Sorry, no posts matched your criteria.

این سایت در ستاد ساماندهی ثبت شده و تابع قوانین جمهوری اسلامی میباشد

بهترین کتابخانه‌های پایتون ویژه داده‌کاوی

۲۰ دی ۱۳۹۷
بدون نظر


گزارش منتشر شده از سوی builtwith.com نشان می‌دهد که ۴۵ درصد از شرکت‌های فناوری ترجیح می‌دهند از پایتون در دو حوزه برنامه‌نویسی تحت وب و هوش مصنوعی استفاده کنند. ترکیب نحوی و ساده بودن کار با کتابخانه عامل اصلی محبوبیت پایتون در این دو حوزه عنوان شده است. با توجه به این‌که در چند وقت اخیر شاهد بوده‌ایم که گرایش توسعه‌دهندگان ایرانی به سمت برنامه‌نویسی هوش مصنوعی و علم داده‌ها متمایل شده است، در این مقاله تصمیم گرفتیم ۱۰ مورد از پر استفاده‌ترین کتابخانه‌های پایتون ویژه علم داده‌ها را در مجله شبکه معرفی کنیم.

نکته‌ای که لازم است به آن اشاره داشته باشیم در ارتباط با فهرستی است که در ادامه مشاهده خواهید کرد. کتابخانه‌های معرفی شده در این فهرست به دلیل هم‌پوشانی با شاخه‌های دیگر هوش مصنوعی ممکن است در گروه‌های دیگری نیز وارد شوند، اما کاربرد اصلی آن‌ها در ارتباط با علم داده‌کاوی است. این فهرست بر مبنای میزان مشارکت توسعه‌دهندگان و تعداد ستاره‌هایی که هر یک از این کتابخانه‌ها در سایت گیت‌هاب به دست آورده‌اند مرتب شده‌اند. شکل زیر به خوبی این مسئله را نشان می‌دهد.

۱٫pandas

Pandas یک کتابخانه پایتون است که ساختارهای داده‌ها منعطف، سریع و به دور از پیچیدگی‌های رایج را برای کار با داده‌ها یا برچسب‌های رابطه‌ای در اختیار پژوهشگران علم داده قرار می‌دهد تا بینش لازم برای کار با داده‌ها را به دست آورند. این کتابخانه با هدف ایجاد بلوک‌های سازنده سطح بالا برای پیاده‌سازی تحلیل‌های واقعی و به‌کارگیری این تحلیل‌ها در پایتون طراحی طراحی شده است. در حال حاضر نزدیک به ۱۳۲۸ مشارکت‌کننده فعال روی گیت‌هاب این کتابخانه را مدیریت کرده است. کتابخانه‌‌ای که موفق شده است ۱۶۸۹۰ هزار ستاره در گیت‌هاب به دست آورد.

لینک دسترسی:  pandas

۲٫ Matplotlib

(مت‌پلات) Matplotlib یک کتابخانه دو بعدی پایتون است که برای رسم نمودار در زبان پایتون استفاده می‌شود. رابط برنامه‌نویسی این کتابخانه بر مبنای پارادایم شی‌گرایی کار کرده که همین مسئله امکان‌ به‌کارگیری این کتابخانه در نرم‌افزارهای مجهز به رابط گرافیکی همچون wxPaython را ساده کرده است. از این کتابخانه می‌توان برای نوشتن اسکریپت‌های ساده (شبیه به اسکریپت‌های CGI) و به عنوان جایگزین مناسبی برای زبان مطلب استفاده کرد. کتابخانه‌ای که از فرمت SVG پشتیبانی می‌کند. از این کتابخانه همچنین می‌توان در شل IPython، برنامه‌های وب‌سرور و سایر رابط‌های کاربری گرافیکی استفاده کرد. در حال حاضر ۷۷۱ مشارکت‌کننده روی گیت‌هاب این کتابخانه را مدیریت کرده و توانسته است ۸۲۲۴ ستاره روی گیت‌هاب دریافت کند.

لینک دسترسی: Matplotlib

۳٫NumPy

NumPy یک کتابخانه پایه‌ای است که در بیشتر محاسبات علمی در پایتون استفاده می‌شود. این کتابخانه می‌تواند اشیایی شبیه به آرایه‌های N بعدی، توابع پیچیده، ابزارهایی به منظور یکپارچه‌سازی کدهای سی پلاس پلاس، سی و فرترن را ارائه کرده و در نهایت در زمینه محاسبات جبر خطی، تبدیل سری‌های فوریه و اعداد تصادفی استفاده شود. در حال حاضر ۷۰۸ مشارکت کننده از این کتابخانه پشیتبانی کرده و ۸۶۶۶ ستاره از گیت‌هاب دریافت کرده است.

لینک دسترسی:  NumPy

۴٫ SciPy

Scipy یک کتابخانه متن‌باز بوده که در زمینه ریاضیات، مباحث علمی و مهندسی استفاده می‌شود. این کتابخانه شامل ماژول‌هایی است که  در حوزه آمار، بهینه‌سازی، یکپارچه‌سازی، جبر خطی تبدیل سری‌های فوریه، پردازی سیگنال و پردازش تصاویر، معادلات دیفرانسیل و… قابل استفاده است. در حال حاضر ۶۷۰ مشارکت کننده روی گیت‌هاب داشته و ۵۰۹۶ ستاره روی گیت‌هاب به دست آورده است.

لینک دسترسی: SciPy

۵٫ Bokeh

Bokeh یک کتابخانه تعاملی تجسم‌سازی برای پایتون است که به توسعه‌دهندگان اجازه می‌دهد یک نمای بصری زیبا و قابل فهم از داده‌ها را پیاده‌سازی کنند. نمایی که روی مرورگرهای وب مدرن قابل مشاهده است. این کتابخانه به شما اجازه می‌دهد در کوتاه‌ترین زمان و با کمترین زحمت ممکن نمودارهای تعاملی، داشبوردها و برنامه‌های کاربردی مبتنی بر داده‌ها را ایجاد کنید. در حال حاض ۳۲۵ مشارکت کننده از آن پشتیبانی کرده و ۸۴۳۹ ستاره روی گیت‌هاب به دست آورده است.

لینک دسترسی: Bokeh

۶٫Gensim

Gensim یک کتابخانه پایتون بوده که برای مدل‌سازی موضوعات، شاخص‌گذاری مستندات و بازیابی تشابهات در اسناد بزرگ قابل استفاده است. این کتابخانه برای افرادی که در حوزه پردازش زبان طبیعی به فعالیت اشتغال دارند و همچنین افرادی که در زمینه بازیابی اطلاعات فعال هستند مفید است. در حال حاضر ۲۹ مشارکت کننده روی این پروژه مشارکت داشته و ۸۱۰۷ ستاره از گیت‌هاب به دست آورده است.

لینک دسترسی: Gensim

۷٫ Scrapy

Scrapy چارچوب ویژه‌ای بوده که در دو زمینه Web Scraping و Web Crawling قابل استفاده است. به عبارت دقیق‌تر در زمینه خزیدن در وب قابل استفاده است. این کتابخانه به توسعه‌دهندگان اجازه می‌دهد برنامه‌های کاربردی را با هدف خزش در سایت‌ها و استخراج داده‌ها طراحی کنند. رویکردی که شبیه به عملکرد روبات‌های اینترنتی است. البته کاربرد کتابخانه فوق فراتر از این بوده و در زمینه داده‌کاوی، نظارت بر دریافت داده‌ها، آزمایش خودکار و… قابل استفاده است. در حال حاضر ۲۹۵ مشارکت کننده از این پروژه پشتیبانی کرده و ۳۰۰۱۴ ستاره روی گیت‌ها به دست آورده است.

لینک دسترسی: Scrapy

۸٫ StatsModels

StatsModels کتابخانه پایتونی دیگری است که در حقیقت مکملی برای scipy بوده و در زمینه محاسبات آماری شبیه به آمار توصیفی و برآوردی برای مدل‌های آماری قابل استفاده است. در حال حاضر ۱۶۴ مشارکت کننده روی این پروژه فعال بوده و ۳۳۸۳ ستاره روی گیت‌هاب به دست آورده است.

لینک دسترسی: StatsModels

۹٫plotly.ly

Plotly.ly یک کتابخانه گرافیکی تعاملی و متن باز برای پایتون بوده که بر پایه مرورگرهای وب کار می‌کند. این کتابخانه بر مبنای plotly.js که کتابخانه‌ای سطح بالا برای رسم نمودا‌رها است طراحی شده است. plotly.js دست‌کم همراه با بیش از ۳۰ نمونه نمودار در حوزه‌های علمی، گراف‌های سه بعدی، نمودارهای آماری، نقشه‌های مبتنی بر گرافیک SVG، نمودارهای آماری و سایر نمودارهای مشابه در اختیار توسعه‌دهندگان قرار دارد. در حال حاضر ۶۲ مشارکت کننده روی این پروژه در گیت‌هاب فعال بوده و ۴۲۱۸ ستاره به دست آورده است.

لینک دسترسی: plotly.ly

۱۰٫ pydot

Pydot  یک رابط کاربردی برای Graphviz و زبان Graph Description است. این کتابخانه شامل ضمن ارائه رابطی برای Graphviz، کلاس‌هایی برای رسم نمودارها و تبدیل نمودارها به زبان DOT ارائه کرده و شامل یک تجزیه کننده قابل استفاده در پایتون است.

لینک دسترسی:  pydo


منبع : شبکه



مهراب