فایل PowerPoint (اسلاید ها) کارشناسی با موضوع تکنولوژی گوگل

    —         —    

ارتباط با ما     —     لیست پایان‌نامه‌ها

... دانلود ...

بخشی از متن فایل PowerPoint (اسلاید ها) کارشناسی با موضوع تکنولوژی گوگل :

کارشناسی با موضوع تکنولوژی گوگل

تكنولوژی گوگل

«جدا از مشكلات مقیاس گذاری تكنیك های جستجوی قدیمی، برای داده های به این اندازه، تكنیك های جدید رقابتی كه استفاده از نمایش اطلاعات اضافی در فرا متن ها را برای نتیجه‌ جستجوی بهتر شامل می‌شود وجود دارد… خیزش سریع تكنولوژی برای جمع آوری مستندات وب و نگهداری آن ها بصورت بروز لازم و ضروری است. فضای ذخیره سازی باید به نحو موثری جهت ذخیره ایندكس ها و مستندا تشان استفاده شود. سیستم indexing باید صدها گیگابایت از داده ها را به شكل موثری پردازش كند. پرس وجوها باید با سرعت صدتا هزار بار در هر ثانیه انجام شوند» سرجی برین ولاورنس پیج، 1997

در ابتدا BackRub وجود داشت، سرویسی كه به گوگل تبدیل شد. امروزه گوگل با دقت بیشتری به الگوریتم pageRank خود وابسته است. PageRank الگوریتمی انتخابی است كه ارزش را به چیز مهمتر می دهد. نشانگر اهمیت یك صفحه وب تعداد صفحاتی است كه به آن صفحه خاص لینك می شوند.

آقایان بِریِن و پِیچ خیلی زود فاكتور جدیدی را به این الگوریتم اضافه كردند كه رأی را به صفحه مهمتر می داد. ایده آنها این بود كه صفحه ای مهمتر است كه تعداد افراد بیشتری بر روی آن كلیك می كنند.كلیك های بیشتر روی یك صفحه وب باعث می شد كه آن صفحه وب دارای ارزش و اهمیت بیشتری شود. در انتها، آرام آرام فاكتورهای دیگری نیز به این الگوریتم اضافه شد. برای مثال ، تعداد دفعاتی كه محتوای یك صفحه تغییر

می كند نیز یكی از فاكتور های مهم شد.

تكنولوژی pogeRank گوگل دقیقاً به جستجوی اینترنتی وابسته شده است. برای نمونه، الگوریتم رأی گیری(Voting Algorithm) كارایی كمتری در عمل جستجو دارد. توجهی كه گوگل نسبت به تكنولوژی جستجویش كرد، باعث تحت الشعاع قرار گرفتن افكار عمومی راجع به این شركت شد. جستجوی گوگل همانند یك ستاره نوظهوراست‌كه‌درخشندگی‌اش‌ باعث شده تا ناظران نتوانند جهات دیگر این پدیده را به وضوح و دقیق مشاهده كنند.

صرف نظر از این ، گوگل یك شركت تكنولوژی است بعضی از این تكنولوژی ها هنگامی كه دریك توضیح داده می شوند مانند مقاله “The Anatomy of a Large –Scale Hypertextual” كه در همان اوایل مطرح شد، خواستار پیدا می كنند. های اخیر مانند

“MapReduce: Simplified Data search Engine” می توانند به آرامی خوانده شوند با توجه به اینكه گوگل یك تكنولوژی است، توضیح دادن اینكه گوگل چكار می كند، درجملات ساده وقابل هضم قدری مشكل است. شكل زیر یك دید كلی از چهار چوب گوگل را ارائه می كند.

تكنولوژی گوگل از یك پیشرفت پیوسته و یا آنچه كه مدیران مشاور فنی ژاپنی به آن Kaizan می گویند بوجود آمده است. هر تغییر تكنیكی گوگل ممكن است برای كاربران متوسط آن بی اهمیت باشد اما زمانیكه بصورت كامل آن را تفسیر می كنند مزایای فن شناسانه گوگل از ابداعات افزایشی و تصاعدی آن، سازگاری هوشمندانه و ماهرانه برداشت های فایلی – فایلی و تنظیم عالی بیزانس برای لینو كس حاصل می‌شود. زمانی، یك تاریخ نویس تكنولوژی ، از بین صدها پیشرفتی كه گوگل در این نُه سال اخیر آنها را رهبری كرده، قادر به تشخیص یك یا دو اختراع مهم كه برمبنای pageRank است خواهد بود. منتقدین گوگل در آینده خواهند دید كه گوگل هسته پردازش تكنولوژی خود را با منابع مختلف پیوند زده است. جهت توضیح ، ساختار مراكز داده گوگل و ارسال پیام به این مراكز و از این مراكز به جاهای دیگر راههای زیادی وجود دارد كه از طریق محاسبات شبكه ای صورت می گیرد. توانایی گوگل در خواندن داده بصورت همزمان از كامپیوتر های مختلف ، یادآور تكنولوژی BiTorrent است. گوگل از سخت افزار مناسب یا “White box” در مراكز داده اش استفاده می كند كه نشان دهنده خصلت كامپیوتر دوست بودن گوگل است. استفاده از حافظه و دیسك ها برای ذخیره چنیدن كپی از داده ها ناشی از محدودیت های محاسباتی است.

گوگل به تكنولوژی دست یافت، سپس آنها را گلچین كرد و از راههای مختلف نزدیك شدن یك بلاك ساختمان، را به سیستم های با مقیاس بزرگ نمایش داده گوگل از این گلچین كردن و دسته بندی كردن سودهای زیادی برد كه از آن جمله می توان به این موارد اشاره كرد: اولاً چهارچوب محاسباتی گوگل عملكرد سیستم را از سخت افزارهای كم هزینه وبا قیمت نازل جدا كرد. دوماً، گوگل درمورد تنگناهای سیستم عامل هایی از قبیل Solavis ، ویندوز سرور پیشرفته و لینوكس های آماده كاركرده است. سوماً ، گوگل ایده های برنامه نویسی خوبی از زبانهای برنامه نویسی دیگر گرفته ، و توابع و كتابخانه های جدیدی را جهت حذف بیشتر نیازهای كدنویسی دستی برای موازی سازی یك برنامه كاربردی در سر تاسر سرورهای گوگل پیاده سازی كرده است.

طبق نظر جف دین كه یكی از مهندسان ارشد گوگل است، مهندسی گوگل ترتیبی از آشفتگی هاست. این سخن نه شگفت انگیز است ونه لزوماً سخنی منفی است. Googleplex جعبه ای است كوچك جهت برنامه نویسی و طراحی وابزارهای آن پیچیده‌وغیرطبیعی اند. مقابله با مشكلات گوگل را تبدیل به مكانی برای بهترین و درخشنده ترین تكنیك های جهان كرده است. طبیعت خلاق با حركت گوگل تركیب شده و همین امر پیش گویی ابداعات بعدی گوگل را مشكل ساخته است. قبل از مرور دقیق تر قسمت های انتخاب شده از تكنولوژی گوگل ، دیاگرام «چهارچوب محاسبات گوگل» مروری بر Googleplex و برخی از تكنولوژی های آن ایجاد می كند و موضوع بحث این فصل نیز راجع به همین مقوله خواهد بود.

Page Rank جهت كار كردن به مقدار زیادی سیكل محاسبات بر حسب اسب بخار نیاز دارد. هنگامیكه گوگل در سال 1996 در حال پیشرفت بود آقایان برین و پیچ محاسبات را محدود كردند. برای اینكه pageRank كار كند، آنها مجبور بودند طریقه تولید الگوریتم pageRank را بر روی كامپیوترهای معمولی و پیش پا افتاده موجود بفهمند. از ابتدا- و با توجه به تصادف پیشرفت تقریباً مسلم گوگل با مایكروسافت این نتیجه مهم است- گوگل باید مشكل مهندسی نرم افزار و سخت افزار خود را برای به موفقیت رسیدن جستجوها حل می كرد. در حقیقت هنگامیكه راجع به تكنولوژی گوگل بحث می‌كنیم خیلی مهم است كه در ذهن خود این موضوع را داشته باشیم كه pageRank تنها به این دلیل مهم است كه می تواند به سرعت دردنیای واقعی اجرا شود ونه در یك كامپیوتر بی بار ویا دریك آزمایشگاه روشن همراه با نور آبی سوپر كامپیوترها.

شكل تركیبی گوگل: مهندسی نرم افزار وسخت افزار نشان می دهند كه چهار چوب تكنولوژی گوگل دارای دو ناحیه فعالیت است. یك قسمت مهندسی نرم افزار است كه تلاش می كند روی pageRank ودیگربرنامه‌های‌كاربردی‌متمركز ‌‌‌‌‌‌‌‌شود.مهندسی‌نرم افزاری كه در اینجا بكار رفته است به معنای نوشتن كد و فكر كردن درباره اینكه چگونه یك سیستم كامپیوتری عمل كند تابیشترین سرعت عمل را داشته باشد است. سرعت عمل یعنی زمان پاسخ گویی زیر یك ثانیه ، كه گوگل قادر است علی رغم افزایش كاربران، برنامه های كاربردی و پردازش داده ها، آن را حفظ نماید.

3-2:تركیب گوگل: نوآوری سخت افزار و نرم افزار

قسمت دیگر برروی سخت افزار متمركز شده است. گوگل دارای رك های سرور، مكانی برای كابل ها، وسایل خنك كننده و لایه‌های مراكز داده است. بازدهی‌ازهزینه‌های عملیاتی پائین تر است و توانایی مقیاس بندی، بعنوان درخواستی برای افزایش منابع محاسباتی است. با یك گردش سریع تر و حذف كارهای پردرد سر همانند پشتیبانی گرفتن از داده ها، ابداع سخت افزار گوگل، آن را به یك مزیت رقابتی تبدیل كرده است كه بعضی رقبای آن می توانند دراواسط سال 2005 با آن برابری كنند.

Page Rank به همراه لایه های محاسباتی اضافی كه در طی چند سال اضافه شد باعث مشكلات نرم افزاری قابل ملاحظه ای شده است. سیستم گوگل باید صفحات وب را پیدا می كرد و دوجین از آنها را اجرا می نمود، اگرنبودباید صدها صفحه وب‌راآنالیزمی كرد. یك لینك كه به یك صفحه اشاره می كند را درنظر بگیرید، گوگل باید یك توالی ازآنها را برای 8 میلیارد صفحه وب نگهدارد.

برای یك صفحه وب تكی همراه با یك لینك كه به‌آن‌اشاره‌می‌كند مشكل جزئی وبی اهمیت است. یك لینك معادل یك اشاره گر می باشد، اما چه اتقاقی ممكن است رخ دهد زمانیكه یك سایت دارای 10000 لینك باشد كه به آن اشاره می كند گاهی اوقات مشكل خیلی بزرگ می‌شود و محاسبات قابل توجهی لازم دارد. بعضی از این لینك ها احتمالاً از سایت هایی كه دارای ترافیك بیشتری نسبت به بقیه هستند می آیند و بعضی دیگر ممكن است از سایت هایی كه قصد مسخره كردن و دست انداختن گوگل برای تفریح و سرگرمی دارند آمده باشند. محاسبات مرتب كردن مقدار هر كدام از این لینك ها، به كار محاسباتی كه به pageRank مربوط می‌شود اضافه می گردد كه داشتن حساب این فاكتورها كاربزرگی است. اندازه گیری فاكتورهای مختلف بر ضد یكدیگر، برای یك صفحه اگر بدون كمك یك ماشین حساب انجام شود می تواند كار مشكلی باشد. این محاسبات را در نظر بگیرید و آن رابه دو میلیادر صفحه وب اعمال كنید و سپس وظایف محاسبات را به یك سوپر كامپیوتر بدهید.

هنوز هم این كار، هرروزه وقت گوگل و پردازش های pageRank آن را پر می كند. كاربران به این موضوع فكر نمی كنند كه چرا تكنولوژی، یك روال جستجو یا سیصد میلیون پرس وجوی گوگل كه هر روز نیز بكار می برد را تأیید می كند. تكنولوژی گوگل، در یك ثانیه در حدود سیصد و چهل پرس وجورا به دوازده زبان از كاربران دنیا انجام می دهد.

لینک کمکی