rack-local :: عصر هدوپ

مطلب ۸ (قسمت اول) :بررسی MapReduce در مقیاس گسترده با استفاده از هدوپ

در مطالب قبلی چگونگی کار MapReduce با ورودی کم را مشاهده کردید. حالا نوبت آن است که با نگاهی از بالا به پایین سیستم را مورد ارزیابی قرار داده و جریان داده موجود در MapReduce را با ورودی زیاد مورد بررسی قرار دهیم. برای سادگی کار، در مثال قبلی فایل ورودی (Sample.txt) بروی فایل سیستم محلی نگهداری می شد. به منظور گسترش کار، ابتدا می بایست داده ورودی روی یک فایل سیستم توزیع شده که نوعا HDFS (درمطالب بعدی از آن صحبت خواهیم کرد) است، قرار گیرد، تا هدوپ بتواند محاسبات تعریف شده در قالب MapReduce را در سطح کلاستر که در آن هر بخش از داده بروی یک ماشین قرار دارد، به منظور اجرا منتشر نماید.

جریان داده

در آغاز، چند واژه جدید. یک Job در MapRedcue به یک واحد کاری گفته می شود که به دستور client صورت می گیرد که متشکل است از داده ورودی، برنامه MapReduce، تنظیمات اولیه. هدوپ یک Job را به منظور اجرا به تعدادی Task تقسیم می نماید که خود دارای دو نوع است : Map Task , Reduce Task.

ادامه مطلب...

۰ نظر

۰ ۲۷ آذر ۹۳ ، ۲۱:۳۰

مهدی شهیدی صادقی

عصر هدوپ

عصر هدوپ

آشنایی با Big Data و کار با Hadoop

۱ مطلب با کلمه‌ی کلیدی «rack-local» ثبت شده است

مطلب ۸ (قسمت اول) :بررسی MapReduce در مقیاس گسترده با استفاده از هدوپ

عصر هدوپ

عصر هدوپ

آشنایی با Big Data و کار با Hadoop

هدوپ

هادوپ

hadoop

MapReduce

HDFS

Block

namenode

Metadata

Distributed File System

JobTracker

Java

Reduce Function

Map Function

Input Split

HBase

GFS

Yahoo

Comparison

namespace image

edit log

datanode

master-worker

client

Replication

Reduce Task

Map Task

Combiner Function

Shuffle

Flow

rack-local

۱ مطلب با کلمه‌ی کلیدی «rack-local» ثبت شده است

مطلب ۸ (قسمت اول) :بررسی MapReduce در مقیاس گسترده با استفاده از هدوپ