التقنيات

نماذج الشات بوت

يمكن تصنيف الشات بوت إلى فئات مختلفة بناءً على عدة معايير ، وهنا نصنف الشات بوت وفقًا لتقنيات التصميم المستخدمة في النظام الأساسي التجاري.

نموذج استرجاع المعلومات:

في هذه النماذج ، يتم تدريب روبوتات المحادثة على مجموعة من الأمثلة ونتائجها المحتملة. لكل سؤال ، يجد الروبوت الإجابات الأكثر صلة من جميع مجموعة الإجابات الممكنة.على الرغم من أن الروبوت لا يمكنه إنشاء إجابات جديدة ، إلا أنه يمكن أن يؤدي أداءً جيدًا إلى حد ما إذا تم تدريبه على حجم مجموعة بيانات مناسب ، وكانت مجموعة البيانات هذه كاملة ومعالجتها مسبقًا بذكاء. يمكن أن تتراوح الخوارزميات المستخدمة من خوارزمية بسيطة (مثل مطابقة الكلمات الرئيسية) إلى خوارزمية معقدة مثل خوارزميات التعلم الآلي. أيضًا ، لا توجد مشكلة في اللغة والقواعد لأن الإجابات محددة مسبقًا ولا يمكن أن تكون خاطئة من الناحية التركيبية.

مثال: Dialogflow من Google ، Watson من IBM ، ... إلخ

النموذج التوليدي:

النموذج التوليدي (القائم على التعلم العميق) مناسب لبناء روبوتات محادثة ذات مجال مفتوح

مثال: BlenderBot من facebook ، Woebot: الذكاء الاصطناعي للصحة العقلية ، ... إلخ

:نموذج قاعدة المعرفة والفهم

المنصات التي تعمل مع نموذج قاعدة المعرفة والفهم هي روبوتات المحادثة الأكثر دقة وكفاءة. وهي مناسبة لبناء روبوتات محادثة للمؤسسات. بمجرد حدوث التكامل بين هذه التقنيات والتعلم العميق (DL) ، ستصبح هي المهيمنة على خدمات الشات بوت.

مثال: الأخوارزمي

محرك رئيسي لمعالجة اللغات الطبيعيه في الخوارزمي

محلل صرفي ومولد ، مدقق إملائي ، محلل.

محلل ومولد صرفي:

يعد المحلل الصرفي والمولد مكونًا حيويًا لكل معالج NLP تقريبًا.

محلل يقلل من الكلمات إلى شكلها المشترك.

يعمل المولد في الاتجاه المعاكس ، ويولد الكلمات في شكلها النهائي المنحرف كما تظهر في النصوص الجارية.

المحلل والمولد المحرك.

بناءً على هذه المعادلة:

WordToken = بادئة + (جذع | ساق غير منتظم) + لاحقة

طورت شركة الخوارزمي محركها المحلل والمولد ، وفقًا لفكرة التجريد والتسلسل ، بحيث:

الناخب = تجريد كلمة من الرمز المميز

المولد = اللصق - التسلسل

لتقليل رمز الكلمة مرة أخرى إلى جذعها ، يقوم القاطع بتجريدها من جميع البادئات واللواحق من أجل إعادتها إلى شكلها الأصلي غير المعكوس. بحيث يتم إنتاج كلمة نهائية مع تمثيل صرفي كامل.

مدقق املائي:

باستخدام نتائج المحلل الصرفي الخاص بنا ، تم تصميم مدققنا الإملائي لتزويد المستخدم بالخيارات المناسبة للتصحيح الإملائي للكلمة التي بها أخطاء إملائية بترتيب احتمالها.

محلل:

المحلل اللغوي هو الجزء الأكثر أهمية في نظام معالجة اللغة الطبيعية.

يحلل الجملة المدخلة إلى مكوناتها النحوية.

يحل أنواعًا مختلفة من الغموض ، وهي تلك الغموض المتعلق بالنحو وأجزاء النصوص وإحساس الكلمات.

يتكون المحلل اللغوي عادةً من ثلاثة أجزاء أساسية.

محرك الاعراب.

إن السمة المميزة لمحرك التحليل الخاص بنا ، والتي تجعله متميزًا عن محركات التحليل الأخرى المتاحة ، هو اعتماده على استراتيجية تحكم فريدة ونظام تفضيلي مبتكر.

تجمع إستراتيجية التحكم بين المحلل اللغوي MultiStack والمحلل الحتمي ، مما يقلل من التوليد الزائد الناتج عن المحلل اللغوي MultiStack ويمنع الحتمية الهيكلية التي يسببها المحلل الحتمي.

يتم تطبيق المخطط التفضيلي لمزيد من تقييد عدد نتائج التحليل. يمكن تطبيق هذا المخطط التفضيلي إما أثناء تكوين الهيكل أو بعد اكتمال التحليل.

القواعد الرسمية.

إن السمة المميزة لمحرك التحليل الخاص بنا ، والتي تجعله متميزًا عن محركات التحليل الأخرى المتاحة ، هو اعتماده على استراتيجية تحكم فريدة ونظام تفضيلي مبتكر.

قاعدة البيانات المعجمية.

لتضمين التعددية اللغوية على المستوى المعجمي ، تم استخدام هياكل البيانات العامة الشاملة لجميع اللغات. لا تتعامل قاعدة البيانات المعجمية الخاصة بنا مع المدخلات المعجمية كعناصر منفصلة قائمة بذاتها ، ولكن كمجموعة معقدة ومتشابكة من العلاقات المتبادلة. يرسم العلاقات بين الأفعال ومشتقاتها ، وعلاقات المرادفات ، إلخ.

نظام معالجة المعرفة

يجمع نظام معالجة المعرفة بين تمثيل المعرفة (الأنطولوجيا) وأساليب التفكير مع الرسم البياني المعرفي لاكتساب المعرفة.

الأنطولوجي:

الأنطولوجي هو نموذج بيانات دلالي ، أو وسيط تمثيل المعرفة الذي نخزن فيه المعرفة.

هناك ثلاثة مكونات رئيسية للأنطولوجيا:

  • جهات
  • شجرة الأنطولوجي
  • حقائق

جهات

  • فئات (مفاهيم)
  • الأفراد
  • العلاقات (الافعال)
  • الإطارات
  • الخصائص (المفاهيم)

شجرة الأنطولوجي

حقائق

الحقيقة هي وحدة معرفية ، أي ملكية مُعاد تشكيلها إلى مفهوم أو إطار وقيمتها هي حقيقة. الإطار نفسه حقيقة.

حقيقة (ثلاثية دلالية) = خاصية + (مفهوم أو إطار) + قيمة

محرك الرسم البياني المعرفي:

الرسم البياني المعرفي هو نوع من قواعد المعرفة. تم تقديمه بواسطة Google. وتم استخدامه لتحسين نتائج محرك البحث الخاص به وللإجابة على الأسئلة المنطوقة المباشرة في مساعد Google.

الشكل الموضح هو لوحة المعلومات التي يتم تقديمها للمستخدمين في صندوق معلومات بجوار نتائج بحث Google مع المعلومات التي تم جمعها من مجموعة متنوعة من المصادر.

يعتمد الرسم البياني المعرفي على نظرية الرسم البياني (الرياضيات) ، حيث أعيد اختبار الكيانات كعُقد ، والخصائص كحواف.

في الخوارزمي نقوم بتحويل الأنطولوجيا لدينا إلى رسم بياني وإجراء استعلام على الرسم البياني للإجابة على استفسارات المستخدم.

تعلم الآلة

أصبح تعلم الآلة أداة مهمة في جميع مهام معالجة اللغات الطبيعيه تقريبًا في السنوات القليلة الماضية. في نظامنا الأساسي ، يساهم التعلم الآلي بشكل أساسي في مهمتين: استرجاع النية (تصنيف النصوص وتشابه النصوص) وتجميع النصوص. ويعطي نتائج تنافسية حقًا.

تصنيف النصوص:

التحدي الرئيسي لمنصات روبوتات الدردشة هو توقع نية إدخال النص المنطوق. تساعد خوارزميات تصنيف النصوص في هذا التحدي من خلال تقريب كلام المستخدم إلى أحد أمثلة النوايا ذات العلامات الجيدة.

تستخدم منصة الخوارزمي عددًا مختلفًا من الميزات المعجمية والنحوية القوية لإنشاء مصنف نطق دقيق ومرن للغاية. يأخذ هذا المصنف في الاعتبار الجوانب المختلفة ويغطي مجموعة واسعة من كيفية تعبير الناس عن نواياهم وأفكارهم.

تشابه النصوص:

تشابه المستند هو طريقة لقول مدى تشابه نصين مع بعضهما البعض. على سبيل المثال ، إذا قال أحدهم "أريد بيتزا" وقال آخر "أريد شاي". على سبيل المثال ، إذا جاء شخص ثالث وقال "أريد أن آكل بيتزا" فسنقول أن هذا الشخص لديه نفس النية مثل الأول بنسبة 90٪ والثاني بنسبة 70٪ لأن كلماته تشبه النص الأول أكثر من الثانية. هذا التفسير البسيط هو أساس "تشابه المستند". بالطبع هذه المهمة ليست بهذه البساطة لكنها لا تزال على نفس الخط. في ال " تمكن الخوارزميات منصة الخوارزمي من توقع نية المستخدم من قاعدة بيانات الأمثلة. وبما أن قاعدة بيانات الأمثلة هذه كانت شاملة ومتنوعة ، فإن نتيجة التنبؤ القصد ستكون أكثر دقة. . تمكن الخوارزميات منصة الخوارزمي من توقع نية المستخدم من قاعدة بيانات الأمثلة. وبما أن قاعدة بيانات الأمثلة هذه كانت شاملة ومتنوعة ، فإن نتيجة التنبؤ القصد ستكون أكثر دقة. .

تجميع النصوص:

يعد تحليل الدردشات المباشرة ودردشات خدمة العملاء خطوة أساسية في أتمتة هذه العمليات وجعلها أكثر تنظيماً وإفادة. لهذا الغرض ، تتضمن منصتنا مجموعة كلمات قوية ودقيقة للتعلم الآلي.

يستخدم نظام التجميع المنطقي هذا مجموعات البيانات المستخرجة من محادثات خدمة العملاء وأي عمليات تفاعلية أخرى بين أي وكيل وعملاء تجاري. وقم بتجميع هذه الدردشات في عدد من الفئات التي لها مفهوم ذي مغزى للأعمال.

بمساعدة أدوات التجميع المنطوقة لدينا ، سيكون لدى مالكي الأعمال التجارية القدرة على معالجة النوايا الجديدة وغير المخطط لها لعملائهم. يجب أن يضمن ذلك تطويرًا أسرع وقويًا لمجالات العمل المختلفة.

البرمجة المنطقية

اللغة هي أفكارنا وشاشة المنطق. لذلك ، لجعل الروبوتات تتحدث بشكل صحيح ، يجب علينا حقنها بأداة للتفكير المنطقي وتمثيل المعرفة. البرمجة المنطقية هي فرع الذكاء الاصطناعي الذي يمكّن الآلات من تمثيل المعرفة والعقل بشكل منطقي.

منطق الدرجة الأولى:

المنطق الأول هو طريقة لتمثيل الحقائق والعلاقات. تمنحك طريقة التمثيل هذه وسيلة للحكم على الحقائق الأخرى إذا كانت صحيحة أو خاطئة. كما أنه يساعد الآلات على استنتاج حقائق وعلاقات جديدة.

Prolog:

Prolog هي لغة البرمجة المنطقية الأكثر شيوعًا. هنا الحقائق والقواعد تعبر عن المنطق في مجالات مختلفة. يدير Prolog استفسارات حول العلاقات من أجل الحصول على حقائق وقواعد جديدة.

© 2020 الخوارزمي. كل الحقوق محفوظة.

من تطوير بيانات

التسعير

يتم تسعير الخوارزمي في خطط مختلفة ومتوفر في السحابة أو في أماكن العمل.

طلب عرض