歡迎來到培訓(xùn)無憂網(wǎng)!

全國(guó)切換

咨詢熱線 400-001-5729

位置:培訓(xùn)無憂網(wǎng) > 新聞資訊 > 電腦/IT > 人工智能 >  大數(shù)據(jù)不香了?小數(shù)據(jù)人工智能正在崛起,產(chǎn)學(xué)界探索可信AI

大數(shù)據(jù)不香了?小數(shù)據(jù)人工智能正在崛起,產(chǎn)學(xué)界探索可信AI

來源:m.universityresearchassociates.com 發(fā)布人:彭二胖

2021-12-30 22:46:17|已瀏覽:175次

人工智能

     “每購(gòu)買一個(gè)面包就會(huì)有一只柯基失去它的屁股。”
     在這個(gè)段子背后,是面包與柯基屁股的相似性引發(fā)的視覺混淆。
     相似的事物尚且容易引發(fā)人眼的視覺混淆,具有相似特征的數(shù)據(jù)則會(huì)引發(fā)人工智能的誤解,使AI程序抓取的數(shù)據(jù)出現(xiàn)偏差,從而使AI程序作出錯(cuò)誤的判斷。
     利用機(jī)器學(xué)習(xí)的這一特征,攻擊者直接將偽裝的數(shù)據(jù)和信息“注入”人工智能程序,從而污染機(jī)器學(xué)習(xí)模型,誤導(dǎo)AI做出錯(cuò)誤判斷,這一威脅網(wǎng)絡(luò)安全的行為就被稱為“數(shù)據(jù)投毒”。
     一直以來,人工智能都依賴大量的數(shù)據(jù)進(jìn)行模型訓(xùn)練,但這帶來了過度收集個(gè)人數(shù)據(jù)、臟數(shù)據(jù)清洗難度大、數(shù)據(jù)匱乏領(lǐng)域依然存在“數(shù)據(jù)孤島”等問題。近日,美國(guó)網(wǎng)絡(luò)安全和新興技術(shù)局(以下簡(jiǎn)稱“CSET”)發(fā)布研究報(bào)告《小數(shù)據(jù)人工智能的巨大潛力》,指出長(zhǎng)期被忽略的小數(shù)據(jù)人工智能潛力不可估量。
     在當(dāng)下人工智能產(chǎn)業(yè)迅速發(fā)展的情況下,大數(shù)據(jù)行業(yè)正在發(fā)生哪些變化?人工智能行業(yè)的數(shù)據(jù)合規(guī)又將走向何方?
從大數(shù)據(jù)回歸小數(shù)據(jù)
     自2006年,“AI教父”杰弗里·辛頓以及他的學(xué)生魯斯蘭·薩拉赫丁諾夫提出深度學(xué)習(xí)理念后,基于深度學(xué)習(xí)技術(shù)的人工智能浪潮席卷全球。機(jī)器通過學(xué)習(xí)樣本數(shù)據(jù)的內(nèi)在規(guī)律與層次,從而獲得預(yù)測(cè)能力。
     隨著深度學(xué)習(xí)算法從學(xué)術(shù)界走向工業(yè)應(yīng)用,大數(shù)據(jù)資源的使用也越來越普遍。無論是早期如語音識(shí)別、人臉識(shí)別等應(yīng)用數(shù)據(jù)生產(chǎn),還是互聯(lián)網(wǎng)電商體系下的行為數(shù)據(jù)生產(chǎn),都是基于大規(guī)模數(shù)據(jù)分析結(jié)果,以此推動(dòng)了整個(gè)數(shù)據(jù)產(chǎn)業(yè)的發(fā)展。
     在人工智能領(lǐng)域,小數(shù)據(jù)方法并不是新鮮詞。與依托于海量數(shù)據(jù)總結(jié)規(guī)律的學(xué)習(xí)方法不同,小數(shù)據(jù)方法是基于人類的先驗(yàn)知識(shí),在僅有少量數(shù)據(jù)的情況下利用小樣本數(shù)據(jù)集進(jìn)行訓(xùn)練的人工智能方法,大致分為遷移學(xué)習(xí)、主動(dòng)學(xué)習(xí)、強(qiáng)化學(xué)習(xí)、貝葉斯方法、數(shù)據(jù)生成等。
     一方面,在數(shù)據(jù)量較少或沒有標(biāo)記數(shù)據(jù)可用的情況下,不得不基于小樣本數(shù)據(jù)加以人工的先驗(yàn)知識(shí)或者預(yù)訓(xùn)練模型來訓(xùn)練新模型。
     對(duì)于學(xué)術(shù)界而言,早期的模型訓(xùn)練運(yùn)用數(shù)據(jù)量都不多,基于人類先驗(yàn)知識(shí)的遷移學(xué)習(xí)和強(qiáng)化學(xué)習(xí)就是小數(shù)據(jù)方法的初始應(yīng)用。同盾科技合伙人兼人工智能研究院院長(zhǎng)李曉林給記者舉了一個(gè)例子:“我曾經(jīng)參加過一個(gè)實(shí)驗(yàn),對(duì)美國(guó)周邊某種瀕危海象的圖片特征進(jìn)行深度學(xué)習(xí),以此來為動(dòng)物保護(hù)協(xié)會(huì)識(shí)別、去重、入庫(kù)和統(tǒng)計(jì)這種海象的數(shù)量。全球這種海象的數(shù)量一共2000多頭,個(gè)體表面差別很小,在這種情況下只能采用小數(shù)據(jù)方法訓(xùn)練模型。”
     另一方面,隨著深度學(xué)習(xí)算法的發(fā)展,數(shù)據(jù)價(jià)值不斷被挖掘,同時(shí),像開頭所述的“數(shù)據(jù)投毒”等網(wǎng)絡(luò)攻擊使得數(shù)據(jù)治理的工作量加大,對(duì)機(jī)器處理復(fù)雜數(shù)據(jù)的能力也提出了更高的要求。
     “隨著人工智能從感知走向認(rèn)知,逐漸進(jìn)入到商業(yè)本質(zhì),信息處理的維度使得人工智能進(jìn)入到深水區(qū)!碧煸茢(shù)據(jù)CEO雷濤告訴記者,“我們開始接觸到信息化系統(tǒng)因?yàn)榱鞒烫幚硭恋淼男?shù)據(jù),這些交易、流程中的數(shù)據(jù)價(jià)值密度更高,比圖像視覺等傳統(tǒng)信號(hào)體系復(fù)雜得多,因此需要認(rèn)知層的人工智能基礎(chǔ)設(shè)施來挖掘其中的含義!
      雷濤認(rèn)為,在真正擁有推理和解決問題的強(qiáng)人工智能到來之前,在問題泛化表達(dá)能力出現(xiàn)之前,小數(shù)據(jù)可以用于進(jìn)行數(shù)據(jù)本身的優(yōu)化。在機(jī)器模型建立的環(huán)節(jié),需要大量的人借助先驗(yàn)知識(shí)的小數(shù)據(jù)和材料數(shù)據(jù)做交互,比如數(shù)據(jù)衍生、數(shù)據(jù)升維、數(shù)據(jù)降維,都是一些基于答案的數(shù)據(jù)或是基于業(yè)務(wù)的顯性特征,利用算力和數(shù)據(jù)之間做交互,來完成模型更有效的學(xué)習(xí)。
      基于小樣本數(shù)據(jù)的分析偏差也是顯而易見的,李曉林告訴記者,避免小數(shù)據(jù)方法出現(xiàn)失誤,勢(shì)必需要豐富的人類先驗(yàn)知識(shí)作為支撐,進(jìn)行遷移學(xué)習(xí)。
      “當(dāng)下對(duì)小數(shù)據(jù)方法的重視并不意味著就摒棄了基于大數(shù)據(jù)的模型訓(xùn)練!倍匆娍萍糃EO姚明表示,目前小數(shù)據(jù)模型主要用于和大數(shù)據(jù)模型的交叉核驗(yàn),在二者相結(jié)合的情況下完善模型。
      本文由培訓(xùn)無憂網(wǎng)AAA教育專屬課程顧問整理發(fā)布,希望能夠?qū)ο雲(yún)⒓颖本┐髷?shù)據(jù)分析培訓(xùn)的學(xué)生有所幫助。更多大數(shù)據(jù)分析培訓(xùn)課程資訊歡迎關(guān)注培訓(xùn)無憂網(wǎng)大數(shù)據(jù)人工智能培訓(xùn)頻道或添加老師微信:15033336050

      注:尊重原創(chuàng)文章,轉(zhuǎn)載請(qǐng)注明出處和鏈接 http://m.universityresearchassociates.com/news-id-11383.html 違者必究!部分文章來源于網(wǎng)絡(luò)由培訓(xùn)無憂網(wǎng)編輯部人員整理發(fā)布,內(nèi)容真實(shí)性請(qǐng)自行核實(shí)或聯(lián)系我們,了解更多相關(guān)資訊請(qǐng)關(guān)注人工智能頻道查看更多,了解相關(guān)專業(yè)課程信息您可在線咨詢也可免費(fèi)申請(qǐng)?jiān)囌n。關(guān)注官方微信了解更多:150 3333 6050

留下你的信息,課程顧問老師會(huì)一對(duì)一幫助你規(guī)劃更適合你的專業(yè)課程!
  • 姓名:

  • 手機(jī):

  • 地區(qū):

  • 想學(xué)什么:

  • 培訓(xùn)無憂網(wǎng)
免 費(fèi) 申 請(qǐng) 試 聽
提交申請(qǐng),《培訓(xùn)無憂網(wǎng)》課程顧問老師會(huì)一對(duì)一幫助你規(guī)劃更適合你的專業(yè)課程!