دوره آموزشی پردازش متن با زبان برنامه نویسی پایتون، قسمت هفدهم: آشنایی و استفاده از پیکره های متنی NLTK در عملیات متن کاوی (Corpora Access)

دوره آموزشی پردازش متن با زبان برنامه نویسی پایتون، قسمت هفدهم: آشنایی و استفاده از پیکره های متنی NLTK در عملیات متن کاوی (Corpora Access)

برای استفاده از این فیلم آموزشی باید هزینه آن را پرداخت کنید.

شما می توانید 3 دقیقه از این ویدیو را به صورت رایگان مشاهده کنید

سلام دوستان

در خدمت شما هستیم با هفدهمین قسمت از دوره آموزشی پردازش متن (متن کاوی) در زبان برنامه نویسی پایتون

در این قسمت به تعریف، شناسایی و استخراج اسناد موجود در پیکره متنی (Corpus) به کمک کتابخانه NLTK می پردازیم، گفتنی است که بسیاری از عملیت پردازش متن و متن کاوی که تا به الان انجام شده از این پس می تواند بر روی کرپس ها یا همان پیکره متنی اسناد انجام شود که نمونه ای از این عملیات را در این ویدیو مرور خواهیم کرد.

مجموعه اسناد موجود در NLTK یا کرپس ها جزء اسنادی می باشند که توسط دانشگاه های معتبر امریکا آماده شده اند و بسیاری از پژوهشگران عملیات متن کاوی خود را بر روی این مجموعه داده های متنی تست کرده اند و به مقایسه خروجی پژوهش خود با سایر مقالات پرداخته اند.

شکل زیر قطعه کوچکی از برنامه نوشته شده در پایتون را نمایش می دهد. لازم به ذکر است که در تمامی ویدیوها نمونه کد کامل پایتون و فایل پاورپوینت مربوط به آن به همراه فیلم قابل دانلود می باشد.

Corpora Access


از اینکه این ویدئو ها را کپی نمیکنید و برای خود و ما ارزش قائلید سپاسگزارم.


ارادتمند شما: کاظم تقندیکی

موفق باشید

#تفاوت_corpora_و_corpus #مجموعه_اسناد_متنی #داده_متنی #پیکره_متنی
عنوان
1 دوره آموزشی پردازش متن با زبان برنامه نویسی پایتون، قسمت اول: مقدمه و معرفی دوره (Introduction) 13′:38″ رایگان
2 دوره آموزشی پردازش متن با زبان برنامه نویسی پایتون، قسمت دوم: مرتب سازی خطوط داده های متنی (Sorting Lines) 17′:43″ 5,500
3 دوره آموزشی پردازش متن با زبان برنامه نویسی پایتون، قسمت سوم: قالب دهی (فرمت دهی) خطوط پاراگراف داده های متنی (Reformatting Paragraphs) 19′:35″ 5,500
4 دوره آموزشی پردازش متن با زبان برنامه نویسی پایتون، قسمت چهارم: نصب ابزار NLTK به منظور پردازش زبان طبیعی (Install NLTK) 11′:4″ 5,500
5 دوره آموزشی پردازش متن با زبان برنامه نویسی پایتون، قسمت پنجم: جداسازی و شمارش کلمات داده های متنی (Counting Token in Paragraphs) 9′:33″ 5,500
6 دوره آموزشی پردازش متن با زبان برنامه نویسی پایتون، قسمت ششم: تبدیل داده های متنی از باینری به اسکی و بالعکس (Convert Binary to ASCII) 14′:4″ 5,500
7 دوره آموزشی پردازش متن با زبان برنامه نویسی پایتون، قسمت هفتم: خواندن خطوط و جداسازی کلمات داده های متنی به صورت وارونه(Backward File Reading) 15′:51″ 5,500
8 دوره آموزشی پردازش متن با زبان برنامه نویسی پایتون، قسمت هشتم: حذف واژه ها یا کلمات تکرای در یک سند متنی ( Filter Duplicate Words) 11′:21″ 5,500
9 دوره آموزشی پردازش متن با زبان برنامه نویسی پایتون، قسمت نهم: پردازش متن فایل های PDF با کمک کتابخانه PyPDF2 در پایتون (Process PDF) 11′:4″ 5,500
10 دوره آموزشی پردازش متن با زبان برنامه نویسی پایتون، قسمت دهم: استخراج انواع الگوهای رشته ای مانند ایمیل، آدرس وب، تاریخ و ... با کمک کتابخانه re (عبارات منظم) از دل داده های متنی (Extract Emails and Url from Text) 15′:51″ 5,500
11 دوره آموزشی پردازش متن با زبان برنامه نویسی پایتون، قسمت دوازدهم: جداسازی و تفکیک پذیری حرفه ای جملات، واژه های انگلیسی و آلمانی در اسناد متنی (Tokenization Professional) 17′:31″ 5,500
12 دوره آموزشی پردازش متن با زبان برنامه نویسی پایتون، قسمت یازدهم: تغییر ساختار و شکل (رمزنگاری و رمزگشایی) واژه های اسناد متنی (Capitalize and Translate) 18′:53″ 5,500
13 دوره آموزشی پردازش متن با زبان برنامه نویسی پایتون، قسمت سیزدهم: شناسایی و حذف Stopwords از اسناد یا داده های متنی (Remove Stopwords) 16′:11″ 5,500
14 دوره آموزشی پردازش متن با زبان برنامه نویسی پایتون، قسمت چهاردهم: استفاده از پایگاه داده لغوی WordNet به منظور ... (Synonyms and Antonyms-WordNet Interface) 30′:50″ 22,000
15 دوره آموزشی پردازش متن با زبان برنامه نویسی پایتون، قسمت پانزدهم: شناسایی و استخراج Bigrams و تشخیص موضوع یک سند متنی (Extract Topic and Bigrams) 14′:17″ 11,000
16 دوره آموزشی پردازش متن با زبان برنامه نویسی پایتون، قسمت شانزدهم: برچسب‌زنی اجزای کلام در اسناد یا داده های متنی (Tagging Words) 21′:26″ 11,000
17 دوره آموزشی پردازش متن با زبان برنامه نویسی پایتون، قسمت هفدهم: آشنایی و استفاده از پیکره های متنی NLTK در عملیات متن کاوی (Corpora Access) 10′:24″ 5,500
18 دوره آموزشی پردازش متن با زبان برنامه نویسی پایتون، قسمت هجدهم: به دست آوردن فراوانی واژه ای در کرپس (Term Frequency) 15′:58″ 5,500
19 دوره آموزشی پردازش متن با زبان برنامه نویسی پایتون، قسمت نوزدهم: ریشه یابی کلمات به کمک الگوریتم های ریشه یابی (Stemming Algorithms) 11′:4″ 5,500
20 دوره آموزشی پردازش متن با زبان برنامه نویسی پایتون، قسمت بیستم (قسمت آخر): آنالیز احساسات داده های متنی (Sentiment Analysis) 16′:59″ 5,500
21 دوره آموزشی پردازش متن با زبان برنامه نویسی پایتون، قسمت بیست و یکم (تکمیلی 1): خلاصه سازی اسناد متنی (Automatic summarization) 15′:48″ 8,800
22 دوره آموزشی پردازش متن با زبان برنامه نویسی پایتون، قسمت بیست و دوم (تکمیلی 2): ترجمه متن (Text Translation) 10′:53″ رایگان
زمان و قیمت کل 5:39′:58″ 140,800
0 نظر

هیچ نظری ارسال نشده است! اولین نظر برای این مطلب را شما ارسال کنید...

نظر شما
برای ارسال نظر باید وارد شوید.
از سرتاسر توسینسو
تنظیمات حریم خصوصی
تائید صرفنظر
×

تو می تونی بهترین نتیجه رو تضمینی با بهترین های ایران بدست بیاری ، پس مقایسه کن و بعد خرید کن : فقط توی جشنواره تابستانه می تونی امروز ارزونتر از فردا خرید کنی ....