京東莎士比亞系統(tǒng)2.0正式上線
2022-06-16|10:36|發(fā)布在分類 / 多多開店| 閱讀:194
2022-06-16|10:36|發(fā)布在分類 / 多多開店| 閱讀:194
與1.0相比,2.0系統(tǒng)可生成完整的文案段落。在語言表達上更貼切,描述更為精準與切題,此外表達的方式也更加豐富。京東ai研究院常務副院長、深度學習及語音和語言實驗室主曉冬博士透露,在保證ai能夠實現基礎的文字表達后,京東正在將人類的情感表達以及更為的修辭手法例如比喻、排比、擬人等技巧融入其中。。
在2.0的版本中寫作能力有了大幅提升,且表達豐富性等方面均取得了長足進步,能夠幫助商家實現在服飾、居家、個護化妝等品類上的商品詳情描述工作,大幅提高商家的工作效率。而京東也在不斷加大ai智能寫作的投入,目前已經匯聚了京東ai研究院以及京東美國硅谷研究院 。
從單句到段落 文案的一小步 ai的一大步
眾所周知,相較于單句文案寫作,段落文案的生成難度,無論是底層數據庫支撐,還是算法難度上都更具挑戰(zhàn)性,不僅要考慮句子與句子之間的起承轉合,還需保證各分句之間圍繞同一主題進行描述,否則生成的文案有可能出現不切題,句與句之間自相矛盾的風險。京東“莎士比亞”2.0系統(tǒng)打破了這一瓶頸,在長文案的寫作上邁出了堅實的一步。當前莎士比亞能夠根據商家的需要,僅輸入與商品相關的幾個關鍵詞例如“連衣裙”“雪紡”“高跟鞋”三個關鍵詞,生成按鈕,即可生成多個與之相匹配的文案描述。
根據關鍵詞自動生成產品文案
可以看到“莎士比亞”2.0系統(tǒng)能夠判定用戶輸入的多個關鍵詞之間,何為中心詞、何為搭配詞,避免主次不分、描述混亂的現象。除了關鍵詞,商家還可以輸入商品的京東sku生成文案,且可對生成的文案內容做編輯修改,并添加至個人收藏,而機器則會根據用戶修改情況,判別內容優(yōu)劣,下次展示時做出順序調整。
該項目負責人談到:“即便是一些不太常見的關鍵詞,“莎士比亞”系統(tǒng)也能生成段落,這源于我們系統(tǒng)上建立的龐大文案數據庫,能覆蓋商品詳情頁文案中出現的主流描述用語。”
大規(guī)模集成機器學習技術突破ai“語言障礙”
莎士比亞2.0的品類覆蓋擴展至服飾、居家到美妝個護,在短短的3個月里就完成了迭代,其中離不開京東硅谷研究院前臺產品算法團隊與京東ai研究院的通力協(xié)作,使其在算法優(yōu)化上提供了強大的技術保障。“莎士比亞”系統(tǒng)采用的主要算法,是根據用戶輸入的主題詞自動擴展主題詞,自動篩選出比較優(yōu)的候選主題詞序列方案和自適應學習方案,利用大量的數據訓練seq2seq模型后,經過不斷優(yōu)化和迭代得到比較終符合任務要求的模型。對于此次迭代所實現的段落描寫,系統(tǒng)則是基于大規(guī)模集成機器學習技術,結合語義理解、篇章分析、近義詞匹配、情感分析等自然語言處理技術,自動生成切題、通順、有感染力的文案。相對于端對端純粹從數據生成文案的方式,該方法的優(yōu)勢就在于融合了數據和語言學知識,生成出來的文案可讀,且準確匹配輸入信息。能夠真正達到言之有物、打動讀者的目的。
通過京東ai研究院與京東硅谷研發(fā)團隊分工協(xié)作,既利于單一品類的做深、做精,又利于多品類的齊頭并進,雙方技術交流分享互通有無,避免重復研發(fā)、提升效率。比較終生成的文案結果會由專業(yè)的文案同事進行打分,研發(fā)人員根據打分情況做出修正,并根據業(yè)務方的實際需求做出模型調整。
向寫作進發(fā) 讓閱讀者產生共鳴感
硅谷研究院陳力博士表示,ai寫作剛剛開始,莎士比亞將會向寫作發(fā)力,讓機器寫出的文案讓閱讀者產生共鳴般的體驗。而要實現這一點,京東將會集中在以下三點來發(fā)力。
第一,理解詞語本意并進行擴展。對于京東商品描述的寫作,難點就在于對關鍵詞本身的延展,例如我們輸入裙子,計算機能夠理解裙子的意思同時圍繞它能夠延展出裙子樣式的描寫、材質的描寫、搭配的描寫等等,這是十分困難的,尤其是結合商品本身的功能特色,引申出貼切、抽象的場景與畫面,需要機器具備類似人類大腦神經元般的聯想機能,而這絕非輕而易舉,需對數以萬計的漢語詞匯建立映射關系,“喂”給機器學習。
第二,文案風格的準確與豐富。文案的寫作風格能夠根據商品本身的性質去撰寫出恰當的文案風格進行表達,同時京東基于bi(商業(yè)智能)已經實現了對用戶推薦商品的豐富多變,如廣告語、發(fā)現好貨文章、商品詳情頁等文案,也能根據用戶畫像實現智能推送。
第三,押韻美感及平仄韻律的塑造。中國文字博大精深,特別是修辭手法的多元化,漢語寫作中常見的比喻、排比、擬人等修辭手法,一直以來都是人工智能領域的難題。而要做到韻腳的美感和平仄節(jié)奏的變化也是目前人工智能不斷在探索的課題。
“莎士比亞”系統(tǒng)要產出高質量文案,自然繞不開這一研究課題,計劃在3.0階段將加入韻律庫并能夠有平仄的韻律感,上下句銜接時,借助豐富同義詞、近義詞庫的替換引用,就會降低不押韻的概率,使得文案讀起來朗朗上口。
相關閱讀:
京東快車和淘寶直通車有什么區(qū)別
京東快車智能匹配出價怎么操作?
京東眾籌文案怎么寫?把握好這幾點
這個問題還有疑問的話,可以加幕.思.城火星老師免費咨詢,微.信號是為: msc496。
推薦閱讀:
更多資訊請關注幕 思 城。
微信掃碼回復「666」
別默默看了 登錄\ 注冊 一起參與討論!