目前基本還是要靠驗(yàn)證碼, 目前已經(jīng)用了近20年,但這招以后可能不管用了!中英兩國(guó)研究人員聯(lián)合開發(fā)了一套基于GAN的驗(yàn)證碼AI識(shí)別系統(tǒng),能在0.5秒之內(nèi)識(shí)別出驗(yàn)證碼,從 實(shí)際測(cè)試結(jié)果看,可以說宣布了對(duì)驗(yàn)證碼的“死刑判決”。
在互聯(lián)網(wǎng)上進(jìn)行交流時(shí),你如何證明自己是活生生的真人?
這是一個(gè)比較棘手的問題,多年來,這個(gè)問題的解決方案一直就是“驗(yàn)證碼”,就是看看你能夠能成功識(shí)別一系列機(jī)器無法識(shí)別的扭曲字符。這類安全驗(yàn)證工具被稱為“CAPTCHA”(即“全自動(dòng)區(qū)分機(jī)器和人類公共圖靈測(cè)試”)。
驗(yàn)證碼被廣泛用于垃圾郵件過濾、在社交網(wǎng)絡(luò)上,識(shí)別并防止機(jī)器人賬號(hào)發(fā)布冒充真人的內(nèi)容(這些內(nèi)容很可能包含垃圾或欺詐信息)。在過去的20多年里,雖然有過波折,但總體上看,用驗(yàn)證碼解決這類問題是管用的。
但現(xiàn)在,情況可能發(fā)生了變化。
近日,英國(guó)蘭卡斯特大學(xué)、中國(guó)西北大學(xué)、北京大學(xué)的計(jì)算機(jī)科學(xué)家們共同開發(fā)了一種AI系統(tǒng),能夠在短短0.5秒內(nèi)識(shí)別出多種驗(yàn)證碼。該系統(tǒng)已在不同的33個(gè)驗(yàn)證碼系統(tǒng)中進(jìn)行了成功測(cè)試,其中11個(gè)來自世界上最受歡迎的一些網(wǎng)站,包括eBay和維基百科等。
該研究的發(fā)起人之一、蘭卡斯特大學(xué)計(jì)算與通信學(xué)院副教授Zheng Wang表示:這項(xiàng)研究可能會(huì)對(duì)文本式驗(yàn)證碼文本做出“死刑判決”。
這項(xiàng)研究基于深度神經(jīng)網(wǎng)絡(luò)的圖像分類器。深度神經(jīng)網(wǎng)絡(luò)在圖像識(shí)別方面表現(xiàn)出驚人的性能。但是,要構(gòu)建成功的模型,通常需要數(shù)百萬個(gè)手動(dòng)標(biāo)記的圖像才能實(shí)現(xiàn)順利學(xué)習(xí)。這項(xiàng)最新成果的新穎之處在于,它使用生成對(duì)抗網(wǎng)絡(luò)(GAN)來創(chuàng)建訓(xùn)練數(shù)據(jù)。
圖中數(shù)據(jù)為該系統(tǒng)與現(xiàn)行識(shí)別器對(duì)各網(wǎng)站驗(yàn)證碼識(shí)別準(zhǔn)確率的對(duì)比,可以看到,大部分測(cè)試中的成功識(shí)別率都得到了大幅度提升
這套系統(tǒng)不需要收集和標(biāo)記數(shù)以百萬計(jì)的驗(yàn)證碼文本數(shù)據(jù),只需要500組數(shù)據(jù)就可以成功學(xué)習(xí)。而且可以使用這些數(shù)據(jù),來生成數(shù)百萬甚至數(shù)十億的合成訓(xùn)練數(shù)據(jù),建立高性能的圖像分類器。結(jié)果顯示,該系統(tǒng)比迄今為止所見的任何驗(yàn)證碼識(shí)別器系統(tǒng)的識(shí)別精度都高。
這種方法對(duì)于需要大量訓(xùn)練數(shù)據(jù)的任何圖像識(shí)別任務(wù)都是有用的。然而,驗(yàn)證碼識(shí)別在某種程度上是獨(dú)一無二的,因?yàn)檫@類任務(wù)本身處在不斷發(fā)展和變化的狀態(tài)中。
與真人識(shí)別結(jié)果的準(zhǔn)確率對(duì)比情況以及可用性評(píng)分。可以看到,第一項(xiàng)的模型表現(xiàn)達(dá)到100%識(shí)別,超過了真人
早期基于文本的驗(yàn)證碼(如本文縮略圖所示)是該技術(shù)的第一次迭代。但是,到目前為止,我們可能更習(xí)慣于使用范圍更廣的、基于交通標(biāo)志的驗(yàn)證碼。
這種不斷變化的狀態(tài),讓面向驗(yàn)證碼識(shí)別的訓(xùn)練數(shù)據(jù)的收集成為一個(gè)棘手的任務(wù)。(相比之下,學(xué)習(xí)識(shí)別一只狗就不存在這個(gè)問題,因?yàn)楣返囊簧衅渫庥^形態(tài)不會(huì)發(fā)生大的變化),
研究人員表示:“也就是說,當(dāng)我們最終收集到足夠的訓(xùn)練數(shù)據(jù)時(shí),驗(yàn)證碼的形式可能快要(或已經(jīng))發(fā)生變化了,這些變化可能會(huì)讓之前收集的數(shù)據(jù)完全無用。
我們的研究成果提供了一種以更低的成本構(gòu)建驗(yàn)證碼識(shí)別器的新方法。因此,它對(duì)現(xiàn)有的驗(yàn)證碼體系構(gòu)成了真正的威脅,因?yàn)樗梢砸愿斓乃俣鹊貙W(xué)習(xí)驗(yàn)證碼的解算器。“
-
機(jī)器人
+關(guān)注
關(guān)注
211文章
28607瀏覽量
207861 -
GaN
+關(guān)注
關(guān)注
19文章
1953瀏覽量
73882
原文標(biāo)題:基于GAN的驗(yàn)證碼識(shí)別工具,0.5秒宣告驗(yàn)證碼死刑!
文章出處:【微信號(hào):tyutcsplab,微信公眾號(hào):智能感知與物聯(lián)網(wǎng)技術(shù)研究所】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論