系統(tǒng)之家 - 系統(tǒng)光盤下載網(wǎng)站!

當前位置:系統(tǒng)之家 > IT快訊 > 詳細頁面

微軟將開源數(shù)據(jù)庫 增強機器的閱讀理解能力

編輯:jiayuan 2016-12-19 15:44:04 來源于:網(wǎng)易科技頻道

  溝通是任何事物了解彼此的最大障礙,學習、理解不同的語言是它的基礎。據(jù)悉為了解決機器與人類溝通的難題,微軟將發(fā)布一個免費的數(shù)據(jù)庫來幫助機器創(chuàng)建更多的對話。

微軟將開源數(shù)據(jù)庫 增強機器的閱讀理解能力

  該數(shù)據(jù)庫名為微軟機器閱讀理解數(shù)據(jù)庫(簡稱MS MARCO),包含有10萬條英文查詢及對應回答。用來幫助人工智能系統(tǒng)更好地理解人類語言。

  微軟合作伙伴集團項目經理Rangan Majumder在周五的一篇博客中提到,微軟將免費開放MS MARCO,并希望能夠與其他機構合作來更好地提高機器的閱讀理解能力。

  數(shù)據(jù)庫中的資料來源于必應搜索和Cortana,并做相應的匿名處理。對問題的回答則是基于互聯(lián)網(wǎng)、人類手工編寫以及經過驗證的信息。這些查詢和回復將用于建立深度學習模型。

  當前,該數(shù)據(jù)庫將對非商業(yè)用途的用戶提供免費下載。同其他人工智能數(shù)據(jù)庫開源計劃類似,微軟也將采用同樣的方式開源MS MARCO。

  其中的一項是ImageNet,可用于訓練圖像識別算法的圖片標記數(shù)據(jù)庫。微軟此前在開發(fā)圖片識別技術時用到ImageNet,現(xiàn)在又用該數(shù)據(jù)庫來強化微軟計算機視覺API等產品。如果想了解更多有關MS MARCO的信息,可下載其研發(fā)團隊發(fā)表的論文。該團隊還在進行另外一項挑戰(zhàn),用MARCO的數(shù)據(jù)來評估訓練模型,而評估腳本也還在研發(fā)中。

  這項開源計劃也是微軟進一步發(fā)展其人工智能的舉重要措。微軟一直以來都在打造基于機器學習和人工智能的Azure云平臺,同時在Office和Windows中也加入了一些人工智能的特性。本周早些時候,微軟推出了QnA Maker云服務,用于降低開發(fā)者研制問答聊天機器人的難度。

  人工智能的每一絲進步,都離不開工程師與海量信息的幕后支持。隨著微軟開源計劃的實施,人工智能領域無疑迎來了更進一步的契機!或許未來的某一天,機器真的能和人溝通呢。

標簽 微軟

發(fā)表評論

0

沒有更多評論了

評論就這些咯,讓大家也知道你的獨特見解

立即評論

以上留言僅代表用戶個人觀點,不代表系統(tǒng)之家立場

官方交流群 軟件收錄