ديجي كالا چگونه مديريت بخش كامنت را به دست هوش مصنوعي سپرده است
اواخر آبانماه سال جاري ديجيكالا با انتشار خبري اعلام كرد كه بخش اعظم مديريت بخش كامنتها در اين فروشگاه به هوش مصنوعي سپرده شده است. براي آگاهي از كم و كيف اين سيستم به گفتوگو با مديران ديجيكالا نشستيم. در اين گفتوگو، وحيد پولادي، مدير بخش محتواي ديجيكالا و نويد شهدي، مدير بخش هوش مصنوعي، به ارائه اطلاعاتي در رابطه با اين سيستم پرداختند.
اميرحسن موسوي، مدير روابط ديجيكالا، در ابتداي گفتوگو اعلام كرد كه براي توسعهي اين سيستم دو تيم محتوا و هوش مصنوعي درگير بودهاند. البته به گفتهي موسوي، پيش از تشكيل تيم هوش مصنوعي، يكي از استارتاپهاي حاضر در ديجيكالا نكست در اين فرايند شركت داشته كه در ادامهي ماجرا با تشكيل تيم هوش مصنوعي ديجيكالا به مديريت نويد شهدي، فرايند توسعه به تيم هوش مصنوعي ديجيكالا سپرده شده است.
- كامنت متخصصان چه جايگاهي در ساختار محتواي ديجيكالا دارد؟
- وحيد پولادي: فرايند مديريت محتوا در ديجيكالا پس از گذشت ۱۵ سال از تأسيس اين فروشگاه اينترنتي، سومين نسل خود را پشت سر ميگذارد و با توجه به افزايش تنوع كالاها، ديگر استراتژي توليد محتوا بهصورت متمركز پاسخگو نيست و از اينرو كامنت متخصصان براي كالاهاي مختلف نقش بسيار پررنگتري به خود گرفته است. با افزايش تنوع كالايي، توليد محتوا بايد با مشاركت متخصصان و از طريق كامنتها انجام شود. تغيير استراتژي محتوايي ديجيكالا باعث شد رويهاي براي تشويق متخصصان به منظور كامنت گذاشتن در پيش گرفته شود و در نتيجه تعداد كامنتهاي ثبتشده افزايش يافت؛ بهطوريكه در حال حاضر متخصصان ديجيكالا بهصورت روزانه ميانگين بيش از ۴۰ هزار كامنت (ركورد بيش از ۶۰ هزار كامنت در يك روز) در اين فروشگاه ثبت ميكنند. با پيادهسازي امكان ضميمه كردن تصاوير و ويدئو در كامنت، به اين نتيجه رسيديم كه مديريت اين بخش وظيفهي بسيار سنگيني به تيم محتوا تحميل ميكند؛ براي مثال تعداد كامنتها طي يك ماه اخير بيش از ۵۰ درصد افزايش يافته است. اول با يك استارتاپ كه در ديجيكالا نكست فعال بود، در خصوص اين موضوع وارد مذاكره شديم؛ اما پس از گذشت مدتي متوجه شديم راهكار اين استارتاپ قابليت پيادهسازي در سيستم ديجيكالا ندارد. همزمان با اين موارد، نويد شهدي وارد ديجيكالا شد.
- توسعه سيستم هوش مصنوعي چندماه طول كشيد و پيشرفت اين سيستم چطور بوده است؟
- نويد شهدي: من ابتداي امسال به ديجيكالا اضافه شدم و مديريت تيم هوش مصنوعي را بر عهده گرفتم. پس از تشكيل تيم هوش مصنوعي، ما با تيمهاي متعدد فعال در ديجيكالا به صحبت نشستيم تا چالشها و گلوگاههايي كه ميشد با راهكارهاي مبتني بر هوش مصنوعي حل كنيم، شناسايي كنيم. موضوع مديريت كامنتها از جملهي مواردي بود كه انرژي زيادي از تيم محتوا ميگرفت و توسعهي يك الگوريتم مبتني بر يادگيري ماشين ميتوانست بار اين كار را سبكتر كند.
اوايل سال جاري و پس از توافق براي پيادهسازي اين سيستم، يكي دوماه مذاكره براي مشخص كردن قوانين صرف كرديم و سه ماه طول كشيد تا ديتاي مورد نياز جمعآوري شود. تيم محتوا كار خود را آغاز كرد؛ بهطوريكه تمام دادهها بالغ بر يك ميليون و هشتصدهزار كامنت با ليبل گردآوري شد. اوايل مهرماه ۱۳۹۹ اين سيستم تأييد خودكار مورد استفاده قرار گرفت.
البته پيش از توسعهي سيستم جديد، يك الگوريتم ديگر مورد استفاده قرار ميگرفت كه فقط قادر بود در مورد رد كردن كامنتها اظهارانديشه متخصصين كند. البته اين سيستم تنها قادر به رد كردن ۲ درصد كامنتها بوده است. قطعا افزايش تعداد كامنتها باعث شد اين سيستم عملكرد چندان مثبتي نداشته باشد؛ درحاليكه درصد موففيت الگوريتم هوش مصنوعي جديد براي رد، تأييد يا شناسايي بهعنوان كامنتي كه بايد عامل انساني در مورد آن انديشه متخصصين دهد، بيش از ۹۸ درصد است.
توسعه، يادگيري و آزمون اين سيستم حدود ۶ ماه زمان برد و در حال حاضر ۷۵ تا ۸۰ درصد از كامنتهاي ثبتشده توسط سيستم هوش مصنوعي مديريت ميشود.
- آيا هوش مصنوعي موفق شده است برداشت سليقهاي عامل انساني در قوانين تأييد يا رد هم انديشي ها را برطرف كند؟
- نويد شهدي: با توجه به برداشت سليقهاي عوامل انساني از قوانين تعيينشده براي رد يا قبول كردن كامنتها، اين موضوع با اضافه شدن ماشين و هوش مصنوعي از بين رفته است؛ البته اين اشكال خيلي محدود بود و تناقض عملكرد در رد يا تأييد كامنتها چندان پررنگ نبود.
- اغلب چه كامنتهايي منتشر نميشوند؟
- وحيد پولادي: كامنتها بهعنوان بخشي از محتواي ديجيكالا در انديشه متخصصين گرفته ميشوند و از اينرو بسيار ارزشمند هستند. اما برخي كامنتها ارتباطي با كالا مورد انديشه متخصصين ندارند و بيشتر به تشريح تجربهي خريد ميپردازند كه از اينرو منتشر نميشوند. براي مثال به كامنتهايي در رابطه با شكايت از دير رسيدن كالا اشاره كرد كه ارتباطي با خود كالا ندارد. البته منتشر نشدن كامنتها در خصوص اشكالات اينچنيني به منزلهي ناديده گرفته شدن آنها نيست؛ اين نوع كامنتها هرچند در صفحهي مورد انديشه متخصصين منتشر نميشوند؛ اما پيام متخصص در قالب يك مسئله درونسازماني براي پيگيري به واحدهاي مربوط ارسال ميشود. در فاز بعدي نيز تلاش بر اين است تا تشخيص اين كامنتها توسط هوش مصنوعي انجام شود.
- پردازش طبيعي زبانها، ديتاي جالبي جز تأييد و رد هم انديشي ها در اختيار قرار ميدهد؛ آيا برنامهاي براي گسترش استفاده از قابليتهاي هوش مصنوعي و اطلاعات استخراجشده وجود دارد؟
- نويد شهدي: تأييد يا رد كامنتها را بايد بخش كوچكي از سيستم هوش مصنوعي مرتبط با كامنتها عنوان كرد كه در دست توسعه داريم. اطلاعاتي كه متخصصان در قالب كامنتهاي براي محصولات مختلف ثبت ميكنند، در زمينههاي بسياري قابل استفاده است. براي مثال با استفاده از كامنت ثبتشده براي يك محصول، ميتوان نقطهي قوت و ضعف محصول را استخراج كرد و همچنين توصيه براي خريد يا نخريدن محصول را براساس منظور متخصص از كامنت استنباط كرد. اطلاعات برگرفته از متخصصان در قالب كامنتها را كه اتفاقا حجم بالايي نيز دارند، ميتوان در انواع سناريوهاي مختلف مورد استفاده قرار داد كه از جملهي اين متخصصدها ميتوان به بخش هم انديشي ها، بخش پيشنهاد به متخصصان ديگر و رتبهبندي محصولات استفاده كرد.
- وحيد پولادي: استفاده از هوش مصنوعي علاوه بر اينكه بار عملياتي كنترل كامنتها را كم ميكند، در آينده باعث خواهد شد بتوان معناي كامنتهاي ثبتشده را استخراج كرد. براي مثال در مورد يك موبايل هوشمند، احتمالا كامنتهايي در مورد ماژولهاي مختلف نظير باتري، دوربين و ساير موارد با نقد عملكرد هر يك از اين ماژولها شامل موارد نكات مثبت و منفي ثبت شده است. هوش مصنوعي پس از تصميمگيري در مورد انتشار يا رد شدن كامنت، ميتواند توصيه براي خريد يا عدم خريد محصول را براساس معناي هر يك از كامنتها بهصورت خلاصه به متخصصان نمايش دهد. متخصصد ديگري كه براي اين سيستم در انديشه متخصصين گرفته شده، جلوگيري از انتشار كامنتهاي غير واقعي است.
- ارزش بالا و وجود كالاهاي غير اصل از جمله انتقادات واردشده به ديجيكالا است؛ آيا برنامهاي براي هوش مصنوعي به منظور شناسايي چنين مواردي داريد؟ آيا سيستم گزارشدهي كامنتها ميتواند در اين موارد كمك كند؟
- وحيد پولادي: براي درك اينكه چطور يك كالاي غير اصل در همان ابتدا شناسايي نميشود، بهتر است ابتدا نگاهي به فرايند ثبت يك كالا در ديجيكالا داشته باشيم. سيستم ديجيكالا به نوعي طراحي شده است كه امكان ثبت كالاي مشابه در آن وجود ندارد. براي مثال در صورتي كه يك ساعت اورجينال توسط يك فروشنده در حال فروش باشد، ديجيكالا اجازه نميدهد تأمينكنندهاي ديگر اين محصول را با ايجاد يك صفحهي محصول جديد عرضه كند. حال فرض كنيد كه تأمينكنندهي دوم، نسخهي غير اصل كالاي مورد انديشه متخصصين را براي فروش قرار داده است و از اينرو هر دو كالا از طريق يك صفحه محصول با تأمينكنندگان مختلف به فروش ميرسند. در اين شرايط وقتي متخصصي كامنتي در مورد غير اصل (فيك) بودن كالا منتشر ميكند، بلافاصله موضوع به بخش مانيتورينگ ماركتپليس گزارش ميشود و اين بخش از تأمينكننده درخواست ميكند مدارك خود دال بر اصل بودن كالا را ارسال كند. در صورتي كه تأمينكننده قادر به اثبات ادعاي خود مبني بر اصل بودن كالا نباشد، ديجيكالا كالاي اين تأمينكننده را حذف ميكند. پس استفاده از هوش مصنوعي فقط به شناسايي كامنتها در اين رابطه محدود ميشود.
- نويد شهدي: پروژهاي طولانيمدت تعريف شده است كه در انديشه متخصصين داريم با استفاده از فاكتورهاي مختلفي نظير ارزش محصولات در بازار آفلاين، ارزش دلار و ساير پارامترهاي دخيل، به برآورد ارزش كالاها بپردازيم. كامنت در مقطع فعلي نميتواند نقش مؤثري براي محاسبه ارزش داشته باشند؛ هرچند ميتوان با استفاده از كامنتها فهميد انديشه متخصصين متخصصان در رابطه با ارزش چيست.
- با توجه به تغيير استراتژي محتوايي ديجيكالا در مورد بخش كامنت، چه برنامهايهايي براي اين بخش داريد؟
- وحيد پولادي: ما در انديشه متخصصين داريم روند كامنتگذاري را به سمت محتواي ويديويي سوق دهيم و در جريان اين تغيير و تحول، به متخصصانمان نيز يادگيري دهيم تا بتوانند ويديوهايي باكيفيت توليد كنند. براي مثال متخصصان ميتوانند براي كالاهاي مختلف ويديوي جعبهگشايي توليد و در صفحهي محصول آپلود كنند و حتي در آينده قادر خواهند بود از اين ويديوها درآمدزايي كنند.
انديشه متخصصين شما در خصوص استفاده از هوش مصنوعي براي مديريت محتوا و استخراج معنا چيست؟
هم انديشي ها