内射少妇白虎,国产伦精品一区二区三区高清版禁,中文字幕综合亚洲一区,国产精品久久久久9999县

您的位置:首頁 > 資訊 > 行業(yè)動態(tài) > 正文

微軟芮勇:計算機視覺已通過圖靈測試 但路還很長

2016-08-13 10:45 性質:轉載 來源:網(wǎng)易
免責聲明:中叉網(wǎng)(www.mama114.cn)尊重合法版權,反對侵權盜版。(凡是我網(wǎng)所轉載之文章,文中所有文字內(nèi)容和圖片視頻之知識產(chǎn)權均系原作者和機構所有。文章內(nèi)容觀點,與本網(wǎng)無關。如有需要刪除,敬請來電商榷?。?/div>
8月13日消息,由中國計算機學會(CCF)主辦、雷鋒網(wǎng)承辦的全球人工智能與機器人峰會(GAIR)在深圳召開,在峰會現(xiàn)場,微軟研究院芮勇...

  8月13日消息,由中國計算機學會(CCF)主辦、雷鋒網(wǎng)承辦的全球人工智能與機器人峰會(GAIR)在深圳召開,在峰會現(xiàn)場,微軟研究院芮勇發(fā)表了名為《計算機視覺:從感知到認知的長征》主題演講。

  芮勇在演講中表示:計算機視覺是人工智能中非常重要的一個方向,在過去50多年間,計算機視覺經(jīng)過了對圖片的攝取、處理、識別和理解的過程。

  首先是特征提取,對于圖像中的像素進行重要性差別提取,然后再對重要的元素進行標注,通過標記成為計算機能夠識別的符號,讓計算機能夠理解圖片的內(nèi)容,生成一句話對圖片進行描述。這是目前微軟研究院能夠做到的,并且成功通過圖靈測試。

  他介紹稱,深度學習徹底改變了圖像識別領域,未來計算機視覺還能實現(xiàn)圖片更高層次的識別,甚至達到視頻識別,對于輸出方面,不僅能夠輸出一句話,還能通過給AI發(fā)送圖片進行聊天,計算機自動識別圖片,并對圖片發(fā)送者進行邏輯對話。

  最后,芮勇稱讓計算機視覺識圖還有很長一段路要走,但隨著從感知到認知的技術發(fā)展,給計算機一幅圖片,讓它給你一個故事是可以實現(xiàn)的。(Sherwood)

  以下是芮勇的演講實錄:

  非常高興下午有這個機會跟大家聊聊計算機視覺,我的題目叫《計算機視覺從感知到認知的長征》。

  我想回顧一下計算機視覺過去50年的發(fā)展。今年的2016年也是人工智能這個詞被創(chuàng)造出來的第60年,之前其實沒有這么一個詞,60年中國人叫一個輪回,輪回總是會有大的飛躍,我們看看2016年人工智能有什么大的飛躍?

  人工智能從最開始有很多的領域,我本人花的時間最多的是計算機視覺,人有各種感官,但人70%的信息是靠人的眼睛來看到的,計算機視覺也是人工智能當中一個非常重要的方向。

  最早大家說能不能可以讓計算機可以看到,像人類的眼睛可以看到一樣。過去的50年的發(fā)展,我們可以看到,是從社群到處理到Recognition到理解,就像我們畫一幅畫一樣,從最早的線條,到一定的灰度,到最后的全彩色的,這50年都做了些什么事情?我們可以看一看,我想用這張圖片跟大家分享一下。

  人看一張圖片覺得很簡單,我一看覺得這是一個人、這是一張桌子、椅子,人一下就理解了,計算機看到的很難,因為計算機看到的就兩個東西,不是0就是1,讓計算機看到圖片里包含什么內(nèi)容非常困難。這50年走過了很多路,從最早的特征提取,比如說這么一幅圖,它的特征有線條、有轉角,有色彩,之后第二步比這個更前進,叫標注。這幅圖比如說是一個戶外的場景,里面有人物,比這個更前進一步,叫Annotation。比這個再往前走一步,我們對圖片的理解就是Captioning,我如果把這個圖片給計算機去看,它能不能生成一段我們?nèi)祟惪吹枚牭枚奈淖?,比如喬治和他的父親在迪士尼樂園在玩一個游戲,這么一句話,這就更難了。比這個再難一點,我給計算機這個圖片,我問計算機幾個問題,比如說這個圖片里面坐在前面那個人穿什么顏色的衣服?計算機這時候要知道什么是人,衣服在哪里,它要回答是紅色的衣服,這就更難了。比這個再難一些的就是我們小時候都上過課,叫做看圖認字,看圖說話,計算機看到一幅圖之后,能不能生成一個故事,這就是這50年我們大家孜孜不倦想做的事情。

  我們來回顧一下這50年是怎么走的,第一步是特征提取,計算機看到的除了0就是1,當然有些像素更加重要,哪些象素作為提取這很重要,比如這張圖,每一個像素的重要性是不一樣的,畫圈的地方是我們想把它作為特征的一些地方。再往下看,第二步我們想給一個圖片進行標注,進行標注的話,我們就想知道,比如說圖片里面有兩個人,他們是在戶外的活動,這件事情怎么做?我們來看一下是怎么做的。

  這個就是很重要的一個部分,有三個部分,第一個部分是圖片的分類,這個時候我們回答的是什么問題呢?這張圖片里面是不是含有一只小狗。第二個就更難一點,計算機還要告訴這個小狗在什么位置,把它框出來。第三個更難,每一個象素能不能告訴我這個像素是屬于這個小狗身上的像素還是電視機上的像素?一個比一個難。過去的這十年,還有很大很大的發(fā)展,我們來看。

  第一步,圖象分類,圖象分類在計算機視覺里有一個全球性的比賽,叫ImageNet,里面有120萬個訓練樣本,有10萬測試圖像,1000個類別,你讓計算機看沒有見過的圖片,幫你分出來這是1000類里的哪一類。

  2012年之前,深度學習沒有引入計算機視覺之前,大家看看錯誤率,靠右邊的是2010年的錯誤率28.2%。2012年的時候,深度學習第一次被用在圖象識別,錯誤率一下降到16.4%,每年的錯誤率越來越低。2014年有個斯坦福的博士想挑戰(zhàn)一下。我如果告訴你一千類里有兩百來種狗的不同類型你就知道有多難了,我只認識四五種狗,但要做到上百種狗都能對,非常困難。斯坦福博士關在屋子里訓練了幾個月,他的錯誤率是5.1%,去年降到了3.5%,第一次超過了人類的錯誤率。

  2012年深度學習第一次引入計算機視覺,當時有八層,它的錯誤率降低。再往下走,2014年到了19層,錯誤率繼續(xù)降低,到2015年,我研究院的同事做出了152層的極深網(wǎng)絡。大家覺得往下做沒什么了不起,其實想做得深很難,在2015年以前,全球沒有幾個團隊能做到超過20層,因為是訓練不下去的,所以這是一個非常好的工作。用神經(jīng)網(wǎng)絡,不僅是每一層延到下一層,有的之間還可以轉跳。

  這是圖片的分類,解決的問題是圖片里面是不是有只小狗。更難的是這只小狗在什么地方,物體的檢測。七八年以前,全球能做到最好的程度也就是這樣,今天通過深度學習的方式已經(jīng)可以做到這樣的水平。你看最左邊的女士她只是把胳膊肘露出一點,腿露出一點。再往下看,這個大公共汽車后面的司機我們解釋說這是一個人,現(xiàn)在已經(jīng)達到這樣的水平,跟人類的視覺水平已經(jīng)不相上下。

  比物體檢測更加難的是在圖片的每一個像素,像素是屬于小狗還是屬于屏幕?我們可以看一看今天用深度學習的方式,也已經(jīng)可以把像素級的圖像分割做到這樣的水平。

上一頁12

網(wǎng)友評論
文明上網(wǎng),理性發(fā)言,拒絕廣告

相關資訊

  • Neumaier :適用于戶外運行的AGV的新型專利解決方案
    Neumaier Industry GmbH & Co. KG是一家位于德國巴登-符騰堡州霍夫施泰滕的公司。該公司成立于1990年, 專注于工業(yè)鈑金加工以及機電一體化系統(tǒng)的開發(fā)、設計和生產(chǎn)。Neumaier Industry以精度...

    2025-01-16 11:09

  • Fraunhofer FKIE:開發(fā)配備激光雷達技術的機器人探索和評估危險區(qū)域
    德國弗勞恩霍夫通信、信息處理和人機工效學研究所(Fraunhofer FKIE)近期開發(fā)了一款配備激光雷達(LiDAR)技術的機器人,旨在探索和評估危險區(qū)域。該機器人利用激光雷達傳感器生成高精度的三維環(huán)...

    2025-01-16 11:01

  • 蘇黎世聯(lián)邦理工學院開發(fā)了一種基于磁場的定位系統(tǒng)可用于機器人導航
    2025年1月,瑞士蘇黎世聯(lián)邦理工學院(ETH Zurich)的研究團隊在室內(nèi)精確定位技術領域取得了重要突破。他們開發(fā)了一種基于磁場的定位系統(tǒng),利用墻壁上安裝的扁平線圈作為錨點,實現(xiàn)了厘米級的三維...

    2025-01-16 11:00

  • 麻省科技評論:2025年人類能實現(xiàn)的10大科技
    (1)維拉·C·魯賓天文臺今年,智利偏遠地區(qū)將安裝一臺強大的新型望遠鏡,開始對南部天空進行為期十年的勘測。望遠鏡內(nèi)有天文學史上最大的數(shù)碼相機,它將連續(xù)拍攝數(shù)年的照片,幫助天文學家研究暗物...

    2025-01-16 10:57

  • 《華盛頓郵報》:人工智能與互聯(lián)網(wǎng)未來發(fā)展的深度探討
    2025年1月3日,美國《華盛頓郵報》發(fā)表了一篇關于人工智能(AI)和互聯(lián)網(wǎng)未來發(fā)展的評論文章,探討了科技進步對社會的深遠影響。文章指出,隨著AI技術的迅猛發(fā)展,社會各界需要共同努力,確保這些...

    2025-01-16 10:52

  • 思科:2025年5大技術趨勢
    2025年,技術趨勢并不容易確定。未來 12 個月等待我們的技術前景將變得越來越復雜和動態(tài)。一方面,經(jīng)濟的不確定性和消費者行為的快速變化給企業(yè)帶來了越來越具有挑戰(zhàn)性的環(huán)境,另一方面,人工智...

    2025-01-15 09:34

  • ASCM:2025年供應鏈五大值得關注的趨勢
    隨著全球市場的持續(xù)動蕩和技術創(chuàng)新的加速發(fā)展,供應鏈管理者面臨著前所未有的挑戰(zhàn)和機遇。ASCM(供應鏈管理協(xié)會)最新發(fā)布的2025年供應鏈趨勢報告,揭示了未來幾年內(nèi)將深刻影響供應鏈發(fā)展的關鍵趨...

    2025-01-14 09:13

  • 本周工業(yè)車輛行業(yè)熱點回顧(2025.1.5-1.11)
    速行之時,獨自一人可疾步如飛;然而,欲達千里,伴侶同行方能持久不殆。工作一周了,歡迎大家一起關注工業(yè)車輛行業(yè)熱點,過去的一周,行業(yè)發(fā)生了些什么,隨小編...

    2025-01-13 09:25

  • 《therobotreport》:2024 年 10 月機器人投資額將超過 74 億美元
    2024 年 10 月,機器人投資額超過 74 億美元,共進行了 77 輪融資。Waymo的 56 億美元融資領跑了投資總額,這是截至 11 月的一年中最大的單輪融資。10 月份的總額是今年前 10 個月以...

    2025-01-08 10:04

  • 博世在CES 2025發(fā)布最新的《博世技術指南》報告
    在2025年國際消費電子展(CES 2025)上,德國博世集團(Bosch)發(fā)布了最新的《博世技術指南》報告,重點關注人工智能(AI)技能的發(fā)展。該報告基于對中國、印度、德國、英國和美國公眾的調(diào)研,旨...

    2025-01-08 10:00

關注官方微信

手機掃碼看新聞