زبان R یک زبان برنامه نویسی تحلیلی و مدل سازی آماری برای دانشگاهیان، محققین، متخصصین و دانشمندان علم داده | Data Science می باشد که همانند زبان پایتون | Python برای محاسبات آماری | statistics، رگرسیون | Regression، مصورسازی داده ها | Visulization، دسته بندی | Classification، خوشه بندی | Clustring، پردازش متن | NLP، تحلیل داده های سری زمانی | Time Series و ... استفاده می شود. شرکت های بزرگی مانند گوگل، مایکروسافت، فیس بوک و اوبر یادگیری زبان R | آر را برای متخصیص تحلیل داده های خود الزام نموده اند. زبان R برای اولین بار به عنوان یک پروژه تحقیقاتی توسط راس ایهاکا (Ross Ihaka) و رابرت جنتلمن (Robert Gentleman) نوشته شد، و در حال حاضر توسط گروهی از متخصصان علم آمار به نام «تیم هسته نرمافزار R» با صفحهای در آدرس www.r-project.org در حال توسعهٔ فعال میباشد.
به عنوان مثال شکل زیر نمونه ای از کتابخانه های توسعه داده شده توسط این تیم را برای زبان R نشان می دهد. در دوره آمورش R مدرس کاظم تقندیکی تمام تلاش خود را به کار گرفته است تا گام به گام و به شکل کاملا عملی و کاربردی تمام مباحث برنامه نویسی، ساختمان داده های مختلف، تحلیل آماری | Statistics، مصورسازی | Visulization، رگرسیون | Regression، بردارها | Vectors، ماتریس ها، آرایه ها، توابع، پردازش متن | NLP، داده های سری زمانی | Time Series Data، تحلیل احساسات | Sentiment Analysis و ... را به شما دانشجویان عزیز آموزش دهد. برای دانلود نرم افزار زبان برنامه نویسی R می توانید از این لینک استفاده کنید.
لیستی از بسته های (کتابخانه های) توسعه داده شده برای زبان کدنویسی R
برای مشاهده لیست بسته | کتابخانه (های) زبان R می توانید از این لینک استفاده کنید.
پیشنهاد ویژه برای دانشمندان داده : دوره آموزشی علم داده | Data Science
تاریخچه زبان برنامه نویسی R | آر:
شکل گیری زبان برنامه نویسی R | آر به حدود 20-30 سال پیش برمی گردد، این زبان توسعه یافته زبان برنامه نویسی S است که نخستین بار توسط دانشگاه بل در سال 1976 نوشته شد. در سال 1995 نسخه اولیه زبان برنامه نویسی R | آر توسط Ross lhaka و Robert Gentleman در دانشگاه اوکلند، کشور نیوزلند توسعه داده شد و تیم هسته توسعه R در حال حاضر آن را پشتیبانی می کند.
در حال حاضر زبان R برای تمامی پلتفرم های سیستم عاملی 32 و 64 بیتی ارائه می شود.
مصوری سازی | Visualization در زبان R :
یک ویژگی و مزیت مهم زبان برنامه نویسی R | آر، موضوع مصورسازی | Visualization یا همان رسم نمودارها می باشد. یک جمله معروف میگه "مشاهده یک نمودار بهتر از مشاهده و خواندن هزار کلمه است". لذا دانشجو در زبان R به راحتی می تواند با خواندن داده ها، آن ها را در قالب نمودارهای مختلف و زیبا نمایش داده تا به یک درک تحلیلی سریع و قابل استناد دسترسی پیدا کند. در زبان R بسته های | Packages مختلفی برای ارائه نمودارهای مختلف ارائه شده که در تصویر زیر مشاهده می کنید.
دانشجو با نصب هر یک از این بسته ها می تواند داده های عددی خود را در قالب نمودارهای زیبا نشان دهد. از جمله این نمودارها عبارتند از نمودار دایره ای | Pie Chart، نمودار خطی | Line Chart، نمودار میله ای یا ستونی | Bar Chart، نمودار هیستوگرام | Histogram Chart، نمودار پراکندگی | Scatter Chart
ویژگی های زبان برنامه نویسی R | آر:
- R یک زبان برنامه نویسی با رویکرد تجزیه و تحلیل داده ها است.
- R یک زبان برنامه نویسی ساده است که در سال های اخیر به خوبی توسعه یافته است.
- R را می تواند به عنوان یک زبان یادگیری مبانی برنامه نویسی مقدماتی تا پیشرفته استفاده کرد.
- R دارای مجموعه ای از ابزارهای و کتابخانه های منسجم و یکپارچه برای تجزیه و تحلیل داده ها می باشد.
- R برای فرایندهای مختلف محاسباتی بر روی آرایه ها، لیست ها و بردارها استفاده می شود
- R یک نرم افزار منبع باز، قدرتمند و بسیار توسعه پذیر است.
- R نمودارهای گرافیکی بسیار زیبا و شیک را ارائه می دهد.
- R یک زبان تفسیری است.
- آر | R یک زبان برنامه نویسی چندبستره است که بر روی پلتفرم های مختلف سیستم عاملی قابل نصب و اجرا می باشد.
- آر | R یک زبان مناسب برای فرایندها و الگوریتم های مختلف یادگیری ماشین، داده کاوی، متن کاوی و ... می باشد.
- یادگیری زبان آر | R به مراتب ساده تر از زبان برنامه نویسی پایتون | Python می باشد.
مزایا و معایب زبان کدنویسی R
پیشنهاد ویژه برای دانشمندان داده : دوره آموزشی علم داده | Data Science
چرا باید زبان R را آموزش دیده و این دوره رو تهیه کنم ؟
از مهمترین دلایل یادگیری زبان آر می توان به موارد ذیل اشاره کرد
- فرایند یادگیری آسان و عملی
- تجربه بالای مدرس در تحلیل داده ها
- قیمت مناسب پکیج در مقایسه با سایر دوره های موجود
- مناسب برای محققین دانشگاهی
- مناسب برای فرایند های مصورسازی و رسم نمودار
- دارای بیش از 15000 کتابخانه رایگانه و دردسترس
- مناسب و کاربردی برای تحلیل کلان داده ها
- حقوق بالای متخصصان و دانشمندان علم داده
- مناسب و کاربردی برای پیاده سازی الگوریتم های یادگیری ماشین
- کار با محیط RStudio
حقوق تحلیلگر داده ها با استفاده از ابزار R ؟
افراد علاقه مند به تحلیل داده ها، با یادگیری زبان آر در شغل های مختلف می توانند به حقوق بالا و قابل توجه ای دست یابند، در ذیل برخی از این شغل ها و درآمد سالانه آن ها ذکر شده است.
- دانشمند داده (متوسط حقوق - 26,20,000 روپیه)
- تحلیلگر داده (متوسط حقوق - 5,80,000 روپیه)
- تحلیلگر کسب و کار (متوسط حقوق - 4,90,000 روپیه)
- کارشناس هوش تجاری (متوسط حقوق - 8,80,000 روپیه)
- کارشناس تجسم داده ها (متوسط حقوق - 7,20,000 روپیه)
- تحلیلگر کمی (متوسط حقوق - 6,40,000 روپیه)
آیا از R می توان در حوزه های مختلف استفاده کرد؟
بله، امکان کاربرد کدنویسی R در حوزه های مختلف نظیر یادگیری ماشین، پردازش زبان طبیعی و ... با افزودن بستههای ایجاد شده توسط کاربران آن، یکی از ویژگیهای مهم این نرمافزار است. این بستهها توسط R، LaTeX، جاوا، سی++ و فورترن نوشته شدهاند. کاربران میتوانند در صورت نیاز به برنامهای خاص، بسته مربوط را نصب و از آن استفاده نمایند. در مجموع بیش از 10 هزار بسته در شبکهٔ بایگانی فراگیر آر (CRAN) وجود دارد. این بستهها طیف وسیعی از قابلیتها را در زمینههای مختلف تحلیل دادهها به R میدهند.
محیط کد نویسی زبان آر | R در RStudio
معرفی برخی از بسته | کتابخانه (های) پرکاربرد زبان R
- Tidyr : از کتابخانه Tidyr برای مرتب سازی داده های ساختمان داده های مختلف در زبان R استفاده می شود.
- ggplot2 : از کتابخانه ggplot2 برای طراحی و ترسیم نمودارهای زیبا و شیک در زبان R استفاده می شود.
- dplyr : از کتابخانه dplyr برای تسهیل کردن فرایند تجزیه و تحلیل داده های عددی در نرم افزار R استفاده می شود.
- tidyquant : از کتابخانه tidyquant برای تجزیه و تحلیل داده های مالی و هزینه ای در زبان R استفاده می شود.
- tidytext : از کتابخانه tidytext برای تجزیه و تحلیل داده های متنی و ناساختاریافته در زبان R استفاده می شود.
sentimentr : از کتابخانه sentimentr برای تحلیل احساسات داده های متنی و ناساختاریافته در زبان R استفاده می شود.
e1071 : از کتابخانه e1071 برای استفاده از الگوریتم های یادگیری ماشین نظیر svm، naive bayse و ... در زبان آر | R استفاده می شود.
- rraven : از کتابخانه rraven برای تحلیل داده های صوتی در زبان برنامه نویسی آر | R استفاده می شود.
- deep : از کتابخانه deep برای پیاده سازی الگوریتم های یادگیری شبکه عمیق در زبان برنامه نویسی آر | R استفاده می شود.
زبان R | آر در چه حوزه هایی کاربرد دارد؟
- امور مالی : بیشترین کاربرد علم داده در حوزه امور مالی می باشد. دانشمندان داده با یادگیری الگوریتم ها، ابزارها و زبان های برنامه نویسی حوزه یادگیری ماشین به ویژه زبان R به راحتی می تواند وظایف مالی مانند بررسی ریسک های مالی، مصورسازی داده های مالی در قالب نمودارهای کندل، نمودارهای چگالی، نمودارهای کاهش و غیره انجام دهد. همچنین زبان R به کمک بسته های pdfetch، TFX، pwt امکان داده کاوی داده های مالی را به شکل ساختاریافته مهیاء می کند.
- صنعت بانکداری : همانند موسسات مالی، صنایع بانکی از زبان R برای مدلسازی ریسک اعتباری و سایر اشکال و نمودارهای تحلیلی ریسک استفاده میکنند. زبان R همچنین با استفاده از امکانات Hadoop امکان تجزیه و تحلیل کیفی مشتری، تقسیم بندی مشتری و حفظ مشتری را فراهم می آورد.
- مراقبت های بهداشتی : شرکت های حوزه ژنتیک، بیوانفورماتیک، کشف دارو، اپیدمیولوژی حوزه مراقبتهای بهداشتی از زبان R برای تحلیل های آماری خود استفاده می کنند. با کمک زبان R، این شرکتها میتوانند داده ها را پیش پردازش، مدل سازی و پیش بینی نمایند. زبان R با ارائه بسته Bioconductor امکان تجزیه و تحلیل داده های ژنومی را در این صنعت به متخصصین داده می دهد.
- رسانه های اجتماعی : تجزیه و تحلیل احساسات و داده کاوی داده های موجود در رسانه های اجتماعی برخی از کاربردهای مهم زبان R می باشد. رسانههای اجتماعی یک زمینه چالش برانگیز برای علم داده و دانشمندان داده است زیرا دادههای موجود در وبسایتهای رسانههای اجتماعی عمدتاً ساختاریافته نیستند. زبان آر | R با ارائه بسته SocialMediaMineR اجازه می دهد تا به عنوان ورودی چندین URL را بگیرد و محبوبیت دسترسی آنها را مورد بررسی و تحلیل قرار دهد.
کدام شرکت ها از زبان R برای تحلیل داده های خود استفاده می کنند؟
- فیس بوک : شرکت فیس بوک از زبان R برای به روز رسانی وضعیت و نمودارهای شبکه اجتماعی خود استفاده می کند. همچنین متخصصین علم داده آن برای پیش بینی تعامل و ارتباط افراد از R استفاده می کنند.
- شرکت خودروسازی فورد : فورد یک شرکت وابسته به بستر Hadoop است که برای تجزیه و تحلیل آماری و همچنین انجام امور پشتیبانی مبتنی بر داده از R استفاده می کند.
- گوگل : گوگل از R برای محاسبه ROI در کمپین های تبلیغاتی و پیش بینی فعالیت های اقتصادی در راستای بهبود کارایی تبلیغات آنلاین خود استفاده می کند.
- مایکروسافت : مایکروسافت از R برای تحلیل سرویس Xbox و همچنین به عنوان یک موتور آماری در چارچوب Azure ML استفاده می کند.
- نیویورک تایمز : R در اخبار نیویورک تایمز برای خرد کردن داده ها و آماده سازی نمودارها قبل از چاپ استفاده می شود.
- سرویس ملی آب و هوا : سرویس ملی هواشناسی از R در مراکز پیش بینی و مصورسازی آب و هوایی خود استفاده می کند.
- Twitter : از آر | R برای تحلیل احساسات توییت های گذاشته شده توسط کاربران استفاده می کند.
- Trulia : وب سایت تحلیل املاک و مستغلات از R برای پیش بینی قیمت خانه و نرخ جرم و جنایت محلی استفاده می کند.
- بانک ANZ : ANZ، چهارمین بانک بزرگ استرالیا از R برای تجزیه و تحلیل ریسک اعتباری خود استفاده می کند.