9 أدوات ومكتبات لتحصل على معالجة اللغة الطبيعية
نشرت: 2019-11-20في المنشورات السابقة ، ناقشنا ماهية البرمجة اللغوية العصبية ، والخطوات المطلوبة لتشغيل البرمجة اللغوية العصبية ، وكيف تعمل البرمجة اللغوية العصبية معًا.
الآن بعد أن أصبح لديك فهم أساسي لـ NLP وكيف يمكن أن تساعدك على توسيع نطاق تسويق المحتوى الخاص بك ، يمكنك البدء في البحث عن الأدوات والمكتبات التي تحتاجها للبدء.
هناك جميع أنواع الأدوات المتاحة لجميع أنواع مهام البرمجة اللغوية العصبية. بعضها عبارة عن أدوات مفتوحة المصدر ، مجانية للجمهور ، وبنيت بمساهمات المتطوعين. البعض الآخر ممتاز ، تقدمه الأسماء الكبيرة في الحوسبة ومعالجة البيانات.
حتى Google تشارك في لعبة الذكاء الاصطناعي.
ولكن قبل أن نتعمق في قائمة الأدوات والمكتبات الموجودة هناك ، هناك بعض المصطلحات التي يجب أن تعرفها. ستراني أشير إلى Python و Java و Node في هذا المنشور. إذا لم تكن مطورًا عن طريق التجارة ، فمن المفيد أن تعرف ما هي وما الذي يعمل معه فريق التطوير لديك بشكل عام.
دعنا نحددها بإيجاز ثم نتحدث عن أنواع الأدوات المتوفرة لمساعدتك في إعداد إستراتيجية البرمجة اللغوية العصبية الخاصة بك وتشغيلها.
ما هي Python و Java و Node؟
Python و Java كلاهما لغات برمجة مفتوحة المصدر ، وكلاهما مستخدم لبناء تطبيقات AI و NLP. تعد Python و Java لغتي البرمجة رقم ثلاثة ورقم اثنين ، على التوالي ، وفقًا لـ GitHub ، مضيف تطوير البرامج للمشاريع مفتوحة المصدر.
Node (أو NodeJS) هو إطار عمل يسمح لأدوات AI و NLP بالعمل بلغة أخرى تسمى JavaScript. لاحظ أن Java و JavaScript ليسا نفس اللغة.
أصبحت العقدة مرادفة لـ JavaScript. لذلك عندما تتحدث عن أدوات ومكتبات البرمجة اللغوية العصبية التي تعمل في Node ، فأنت تقول حقًا إنها تعمل في JavaScript.
يشير المصدر المفتوح إلى لغات البرمجة وأطر العمل التي تكون مجانية الاستخدام ويسهل التعامل معها نسبيًا. يمكن للمطورين تخصيص أدوات ومكتبات البرمجة اللغوية العصبية مفتوحة المصدر لتلبية احتياجات علامتك التجارية.
لكن كن حذرًا من أن المصدر المفتوح لا يأتي دائمًا بحلول خارج الصندوق ، مما قد يعني الكثير من التطوير والاختبار قبل أن ينجح أي شيء.
قسط يشير إلى العكس. هذه أدوات ومكتبات قائمة على الاشتراك. إنها توفر عمومًا المزيد من الخيارات الجاهزة التي يمكنك توصيلها بالبنية التحتية الحالية ، والتي يمكن أن تكون مفيدة إذا كنت قد بدأت للتو في تطوير الذكاء الاصطناعي ، أو كنت ترغب في نشر شيء ما بسرعة.
أدوات ومكتبات بايثون للغة البرمجة اللغوية العصبية
سبا
تُعرِّف SpaCy نفسها بأنها "معالجة لغة طبيعية ذات قوة صناعية". إنها مكتبة تحليلات نصية تسمح للمطورين بمعالجة مجموعة متنوعة من مشاريع البرمجة اللغوية العصبية. يدعم SpaCy أكثر من 52 لغة ويفتخر بسرعته ودقته في المعالجة ، بما في ذلك العديد من الميزات مثل العديد من الميزات ، بما في ذلك التعرف على الكيانات المسماة وعلامات PoS.
مجموعة أدوات اللغة الطبيعية (NLTK)
NLTK هي مكتبة NLP Python مفتوحة المصدر معروفة. يوفر جميع أنواع المكتبات للمساعدة في معالجة النصوص وفهم اللغة الطبيعية ، بما في ذلك التحليل الدلالي.
لكن الشيء الأنيق هو التزامها بإمكانية الوصول. توفر العقول الكامنة وراء NLTK أدلة متعمقة تعلم أساسيات البرمجة ، حتى يتمكن حتى المبتدئين من بدء اللعب باستخدام البرمجة اللغوية العصبية.
وفقًا لموقعهم ، فإن نهجهم في برمجة البرمجة اللغوية العصبية يجعلها أداة مفيدة للباحثين والطلاب والمعلمين.
إذا لم يكن فريقك على دراية بالبرمجة بشكل عام ، فقد يكون هذا مكانًا جيدًا للبدء.
TensorFlow
TensorFlow عبارة عن منصة شاملة للشركات المهتمة بالتعلم الآلي ومعالجة اللغات الطبيعية. مكتوب بلغة python / C ++ ، وهو مفتوح المصدر تمامًا ويأتي مع مجموعة متنوعة من المكتبات والأدوات التي يمكن لمطوري البرامج استخدامها لبناء تطبيقاتهم الخاصة.
يتكامل مع أطر مثل Keras ونماذج أخرى عالية المستوى لبناء شبكات عصبية بسهولة وسرعة.
أدوات ومكتبات العقدة الخاصة بالبرمجة اللغوية العصبية
NLP.js
يمكن لـ NLP.js تخمين لغة النص الذي تقوم بتحليله - بل إنه تم تدريبه على التعرف على لغة Klingon! هذه الأداة رائعة لتطبيقات البيانات غير المنظمة مثل الترجمة وروبوتات الدردشة. يحدد 34 لغة مختلفة ويتضمن مصنف معالجة اللغة الطبيعية ومدير توليد اللغة الطبيعية.

هذه الأداة مفتوحة المصدر تمامًا وتعتمد على مساهمات المبرمجين حول العالم.
مكتبات وأدوات Java لـ NLP
اباتشي OpenNLP
وفقًا لموقعهم ، Apache OpenNLP هي أداة مكتوبة من قبل المتطوعين ومفتوحة المصدر للغة البرمجة اللغوية العصبية. إنه "يدعم مهام البرمجة اللغوية العصبية الأكثر شيوعًا ، مثل الترميز ، وتجزئة الجملة ، ووضع علامات على جزء من الكلام ، واستخراج الكيانات المسماة ، والتقسيم ، والتحليل ، واكتشاف اللغة ، ودقة المرجع."
تسمح هذه العمليات للمطورين بإنشاء تطبيقات يمكنها تفكيك أجزاء الكلام ، المنطوقة أو المكتوبة ، وفهمها.
مجموعة ستانفورد لمعالجة اللغات الطبيعية
جعلت جامعة ستانفورد بعض أدوات معالجة اللغة الخاصة بها ، بما في ذلك أدوات البرمجة اللغوية العصبية القائمة على القواعد والتعلم العميق ، متاحة للجمهور. توجد قائمة كاملة بالمكتبات والأدوات الأساسية على مواقعهم ، بما في ذلك مكتبات لوضع العلامات والتحليل وأدوات الترجمة.
ومع ذلك ، من المهم ملاحظة أنه في حين أن منتجاتهم مفتوحة المصدر ، يجب عليك الاتصال بـ Stanford للحصول على ترخيص تجاري قبل استخدامها في أي أدوات مملوكة.
أدوات البرمجة اللغوية العصبية الأخرى
AWS
Amazon Deep Learning AMIs هي خدمة متميزة تمنحك الأدوات اللازمة لتشغيل البرمجة اللغوية العصبية بغض النظر عن لغة البرمجة التي تستخدمها. إنه يعمل أيضًا مع العديد من أطر التعلم العميق الحالية التي ذكرناها ، بما في ذلك Keras و TensorFlow.
آي بي إم واتسون
ربما سمعت عن واتسون في هذه المرحلة. هذه هي آلة الذكاء الاصطناعي التي فازت في لعبة Jeopardy !. لكن Watson يقدم أيضًا أدوات ومكتبات لـ NLP. يمكنك تنزيل حزم Python أو Node أو Java لإنشاء روبوتات محادثة أو إجراء تحليلات للمشاعر على وسائل التواصل الاجتماعي أو تحليل المراجعات عبر الإنترنت ، من بين أشياء أخرى.
Google Cloud Natural Language
يحتوي Google Cloud على خيارين لمعالجة اللغة الطبيعية. الأول هو AutoML Natural Language ، حيث يقوم المطورون بتحميل المستندات الموجودة لتدريب الأداة ، ثم نشرها لأداء العديد من مهام البرمجة اللغوية العصبية. إنه مخصص للمطورين الذين ليس لديهم خبرة كبيرة في الذكاء الاصطناعي أو التعلم العميق أو البرمجة اللغوية العصبية.
تقدم Google أيضًا واجهة برمجة تطبيقات Natural Language الخاصة بها ، والتي تتيح للمطورين الأكثر خبرة إنشاء وإيجاد تحليل النص وتحليل المشاعر وأدوات الترجمة بأنفسهم.
كلاهما موجود في سحابة Google.
ملخص
لكل نوع من احتياجات البرمجة اللغوية العصبية ، هناك أدوات ومكتبات لمساعدتك. سيعتمد ما تختاره كثيرًا على فريق التطوير لديك ، لذا قم بإشراكهم. ستحتاج إلى معرفة مدى إلمامهم بالذكاء الاصطناعي وكذلك مع لغات البرمجة الثلاث التي تحدثت عنها. ستحتاج أيضًا إلى فهم مجموعة التقنيات الخاصة بك وما يمكن أن تدعمه.
اطرح الأسئلة الصحيحة لفريق التطوير لديك ووضح احتياجات مؤسستك. بعد ذلك ، يمكنك اختيار أدوات ومكتبات معالجة اللغة الطبيعية المناسبة للشركة ككل.
