内射少妇白虎,国产伦精品一区二区三区高清版禁,中文字幕综合亚洲一区,国产精品久久久久9999县

您的位置:首頁 > 資訊 > 行業(yè)動態(tài) > 正文

“小會話,大學問”:如何讓聊天機器人讀懂對話歷史?

2017-06-28 06:34 性質(zhì):轉(zhuǎn)載 作者:36氪 來源:36氪
免責聲明:中叉網(wǎng)(www.mama114.cn)尊重合法版權,反對侵權盜版。(凡是我網(wǎng)所轉(zhuǎn)載之文章,文中所有文字內(nèi)容和圖片視頻之知識產(chǎn)權均系原作者和機構所有。文章內(nèi)容觀點,與本網(wǎng)無關。如有需要刪除,敬請來電商榷!)
人工智能現(xiàn)在的火熱程度大家有目共睹,凱文凱利在《必然》中預測未來時代的人工智能可能會重新定義人類的意義,但時下的人工智能發(fā)展水...

  人工智能現(xiàn)在的火熱程度大家有目共睹,凱文凱利在《必然》中預測未來時代的人工智能可能會重新定義人類的意義,但時下的人工智能發(fā)展水平顯然還沒有大家想象得那么美好,仍然需要我們不斷地探索。目前眾多研究人員正深耕其中,作為其中代表的聊天機器人(Chatbot),已然成為科研界研究的熱點。

  通常來說聊天機器人實現(xiàn)方式有兩種:一種是基于生成式,即機器人“自己說話”,一個字一個字創(chuàng)作出回復語句來。另外一種是基于檢索式,即機器人“轉(zhuǎn)發(fā)”別人的話。從互聯(lián)網(wǎng)大家的話語中尋找到合適的回答予以轉(zhuǎn)發(fā)。

  現(xiàn)有的生成結(jié)果由于技術所限,或多或少都存在語句不流暢的問題,但能夠做到“有問必答”偶爾還能蹦出“彩蛋”。檢索的模型一般流暢性方面無須擔心,不過隨著目前網(wǎng)絡資源的日益豐富,語料規(guī)模也越來越大,如何從眾多語句中選擇合適的句子作為回復是檢索式聊天機器人的核心問題。

  雖然目前市場上的聊天機器人眾多,但我們見到的那些貌似都不是那么聰明。最直觀的一個體現(xiàn)就是前后不連貫,上下難銜接,因此在進行檢索的時候考慮歷史信息則顯得尤為重要。那么如何讓機器人理解對話歷史信息從而聰明地進行回復呢?微軟亞洲研究院的研究員們提出了一個模型 Sequential Matching Network(SMN)。相關論文的作者吳俁談到“SMN 模型可以讓聊天機器人準確的理解當前和用戶的對話歷史,并根據(jù)歷史給出最相關的回復,與用戶進行交流,達到人機對話的目的?!?/P>

  但這在實現(xiàn)的過程中也遇到不少難點,“精準計算聊天歷史和候選回復的語義相似度十分困難,主要的挑戰(zhàn)有兩個方面:(1)由于聊天歷史信息繁多,如何將歷史中重要的詞語、短語以及句子選擇出來,并通過這些重要部分刻畫聊天歷史,是一個亟待解決的問題;(2)如何對聊天歷史中的各輪對話進行建模,如何判斷對話歷史中的跳轉(zhuǎn),順承等關系,也是一個棘手的問題?!?那么論文作者提出的 SMN 模型又是如何解決這兩個問題的呢,接下來我們將為您解讀。

  SMN 模型一共分為三層。第一層為信息匹配層,對之前的歷史信息和待回復的句子進行匹配度計算:同時進行詞語(embedding 向量)和短語級別(GRU 表示)的相似度計算。然后再把這兩個矩陣分別作為卷積神經(jīng)網(wǎng)絡的一個 channel,利用 CNN 的 max-pooling 進行特征抽象,形成一個匹配向量。第二層為匹配積累層,利用一個 GRU 神經(jīng)網(wǎng)絡,將每一句話和回復所計算出的匹配信息進一步融合。第三層為匹配結(jié)果預測層,利用融合的匹配信息計算最終的匹配得分,在預測時他們使用三種策略,分別是只利用 GRU2 最后一個隱藏層(SMN_last),靜態(tài)加權隱藏層(SMN_static),和動態(tài)加權隱藏層(SMN_dynamic)。在進行檢索的時候,他們將最后一句的信息結(jié)合上文歷史信息中的 5 個關鍵詞(歷史信息中用 tf-idf 進行篩選,選擇 Top 5 關鍵詞)在系統(tǒng)中進行檢索,然后用上述 SMN 網(wǎng)絡對候選結(jié)果打分從而選出回復句。

  作者分別在 Ubuntu 語料(大型公開計算機相關求助與解答語料)和豆瓣語料(作者從豆瓣小組的公開信息中爬取并在論文中公布)上進行了實驗,分別以 Rn@K 和 MAP、MRR、P@1 為評價指標,取得的結(jié)果均為目前最好。

  作者表示“SMN不同以往的模型,第一步不進行上下文的建模學習,而是讓每句話和回復進行匹配度計算,這樣可以盡可能多的保留上下文的信息,以避免重要信息在學習上下文的向量表示時丟失。而且 SMN 在對上下文句子關系建模時,考慮了當前回復的影響,使得回復成為一個監(jiān)督信號,這樣可以更準確的對上下文歷史進行建模?!辈⑶覅莻R向我們透露“據(jù)我們所知,我們公布的豆瓣語料是第一個人工標注的中文多輪對話語料。”


  在談及目前的方法還有哪些不足之處時,作者表示“目前我們的檢索方式有時找不到正確的候選句,所以第一步的檢索方法還有待改善,另外雖然我們的模型可以建模當前回復和歷史信息的關系,但還是無法避免一些邏輯上的問題,不過這也是我們未來工作的重點,我們將繼續(xù)提高候選回復在邏輯上的連貫性”,讓我們共同期待他們的未來工作。

 

網(wǎng)友評論
文明上網(wǎng),理性發(fā)言,拒絕廣告

相關資訊

  • 開工大吉|迎接工業(yè)車輛行業(yè)的春天
    春回大地,萬物復蘇,我們再次站在了充滿希望的開工季。2025年已然到來,工業(yè)車輛行業(yè)正以嶄新的姿態(tài)和無限的活力,迎接一個充滿機遇與挑戰(zhàn)的新征程。借此機會,...

    2025-02-05 11:16

  • 正月初七|福滿人間 家興業(yè)旺
    福澤四方福星高照春回大地,萬象更新,轉(zhuǎn)眼間我們迎來了正月初七,盡管春節(jié)的喧囂與繁華逐漸淡去,但在中國古老的傳統(tǒng)里,這一天依然是一個充滿意義的日子。這一...

    2025-02-04 11:13

  • 新春初六,醒獅起舞,共啟行業(yè)新氣象
    ( 靈蛇送福 )蛇年初六醒獅舞, 鑼鼓聲聲催人忙。 市場開市迎財神, 商家齊聚福滿堂。燈籠高掛春聯(lián)展, 紅紅火火慶吉祥。 春耕時節(jié)土地暖, 萬象更新迎...

    2025-02-03 11:11

  • 本周工業(yè)車輛行業(yè)熱點回顧(2025.1.26-2.1)
    春節(jié)不僅僅是一個傳統(tǒng)節(jié)日,它更像是一種情感的紐帶,將家人和朋友緊緊聯(lián)系在一起。忙碌的日子里,我們常常忽略了陪伴家人的重要性,而春節(jié)則給了我們一個機會,...

    2025-02-02 13:51

  • 蛇年初五,五福臨門,同心繪就行業(yè)繁榮
    農(nóng)歷大年初五,是傳統(tǒng)文化中除舊布新的日子,象征著新的開始與好運的降臨。在蛇年的第五天,天地交泰,陰陽和合,財神降臨,象征著財富與和諧的交相輝映,預示著...

    2025-02-02 11:07

  • 蛇年初三,生機盎然
    大年初三,春日的陽光灑滿大地,萬物復蘇,生機勃勃,活力四溢。在這重要的節(jié)點,我們心懷感激,為工業(yè)車輛行業(yè)送上最誠摯的祝福。三生萬物,老子智慧之言,工業(yè)...

    2025-01-31 10:37

  • 蛇年初二 共祝行業(yè)新篇
    蛇年春節(jié)今日蛇年大年初二,春光灑滿人間,初二的喜慶如同晨光中最溫柔的一縷,輕輕拂過每一片希望的田野。在這個特別的日子里,我們以工業(yè)車輛行業(yè)媒體的身份,...

    2025-01-30 10:29

  • 龍去蛇來,詩頌叉車行業(yè)新春盛景
  • 新春祝福 | 2025蛇年共創(chuàng)輝煌,攜手邁向新征程
    親愛的工業(yè)車輛行業(yè)同仁們:在這新春蛇年即將到來之際,中國叉車網(wǎng)(www.mama114.cn)謹以此信表達對所有新老朋友的最深切祝福和無盡感激。作為工業(yè)車輛...

    2025-01-28 10:06

  • 本周工業(yè)車輛行業(yè)熱點回顧(2025.1.19-1.25)
    新春佳節(jié)漸行漸近,空氣中似乎已經(jīng)彌漫著年味的氣息。街道上,紅燈籠高高掛起,熙熙攘攘的人群開始忙碌地準備年貨,商場里充滿了喜慶的音樂和促銷活動。雖然每年...

    2025-01-26 13:51

關注官方微信

手機掃碼看新聞