0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

通過界面和功能測(cè)試不能保證AI軟件的質(zhì)量

汽車玩家 ? 來源:黑馬程序員 ? 作者:黑馬程序員 ? 2020-05-05 19:54 ? 次閱讀

近兩年人工智能發(fā)展迅猛,各種應(yīng)用層出不窮,但其質(zhì)量卻是良莠不齊。原因在于大部分測(cè)試童鞋還在用傳統(tǒng)的測(cè)試方式也就是通過界面和功能對(duì)人工智能軟件進(jìn)行測(cè)試,但是AI軟件從開發(fā)到測(cè)試都很不同于傳統(tǒng)軟件,本文就以智能文本分類系統(tǒng)為例通過兩步來介紹為何傳統(tǒng)的測(cè)試方法不能保證AI軟件的質(zhì)量。

一、第一步------------人工智能軟件測(cè)試的痛點(diǎn)

目標(biāo)

掌握人工智能軟件測(cè)試面臨的現(xiàn)實(shí)痛點(diǎn)

步驟

1.智能文本分類系統(tǒng)是AI自然語言處理的一個(gè)基本應(yīng)用,界面如下圖所示

通過界面和功能測(cè)試不能保證AI軟件的質(zhì)量

2.對(duì)其測(cè)試時(shí)需要根據(jù)不同的輸入點(diǎn)擊獲取標(biāo)簽得出所屬的類別以及所屬類別的概率值

3.通過功能和界面進(jìn)行測(cè)試的話需要輸入各種可能輸入的文本,耗時(shí)巨大,并且也不太現(xiàn)實(shí)

4.從界面上對(duì)得到的score代表的概率值進(jìn)行判斷無法得出一個(gè)客觀的評(píng)判,這個(gè)值多少合適判斷不了

5.因此傳統(tǒng)界面和功能測(cè)試完了判斷不了智能文本分類系統(tǒng)能否上線

二、第二步----------------AI軟件測(cè)試的正確方式

目標(biāo)

掌握AI軟件測(cè)試的正確方式

步驟

1.了解AI軟件測(cè)試的本質(zhì)

人工智能軟件是根據(jù)算法對(duì)大量的數(shù)據(jù)進(jìn)行訓(xùn)練找規(guī)律,最終得出一個(gè)模型來對(duì)新的數(shù)據(jù)進(jìn)行預(yù)測(cè),預(yù)測(cè)的時(shí)候會(huì)給出一個(gè)概率值。

2.AI軟件測(cè)試的正確方式

通過實(shí)現(xiàn)人工智能算法自帶的評(píng)測(cè)指標(biāo)來進(jìn)行AI軟件的測(cè)試可以很好的評(píng)估軟件的質(zhì)量,完美解決窮舉各種輸入和概率值大小的現(xiàn)實(shí)問題

3.通過AI模型測(cè)試的具體評(píng)測(cè)指標(biāo)

以智能文本分類為例,其采用了監(jiān)督示機(jī)器學(xué)習(xí)的分類算法,對(duì)應(yīng)的評(píng)測(cè)指標(biāo)有:

準(zhǔn)確率、精確率、召回率

總結(jié)

本文通過智能文本分類系統(tǒng)面臨的測(cè)試難點(diǎn)來指出AI軟件測(cè)試過程中的通用難題。以此指出了通過功能和界面測(cè)試人工智能軟件不能保證AI軟件的質(zhì)量,正確的方式應(yīng)該是通過實(shí)現(xiàn)AI軟件算法自帶的評(píng)測(cè)進(jìn)行進(jìn)行測(cè)試

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    31395

    瀏覽量

    269784
  • 人工智能
    +關(guān)注

    關(guān)注

    1793

    文章

    47587

    瀏覽量

    239465
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    即時(shí)通話軟件音頻傳輸質(zhì)量測(cè)試方案

    使用過程中的音頻傳輸質(zhì)量。即時(shí)通話軟件基于移動(dòng)網(wǎng)絡(luò)鏈路傳輸信號(hào),通過本套測(cè)試方案中配套的網(wǎng)絡(luò)損傷仿真設(shè)備對(duì)傳輸鏈路添加不同的網(wǎng)絡(luò)影響,模擬軟件
    的頭像 發(fā)表于 12-03 14:34 ?207次閱讀
    即時(shí)通話<b class='flag-5'>軟件</b>音頻傳輸<b class='flag-5'>質(zhì)量</b><b class='flag-5'>測(cè)試</b>方案

    AI大模型在智能座艙軟件測(cè)試中的應(yīng)用與思考

    隨著汽車智能化程度的不斷提高,傳統(tǒng)的車輛功能已經(jīng)逐漸向復(fù)雜的軟件系統(tǒng)轉(zhuǎn)型。尤其在智能座艙領(lǐng)域,從多屏交互到增強(qiáng)現(xiàn)實(shí)(AR)的廣泛應(yīng)用,各類新技術(shù)層出不窮,這也使得軟件測(cè)試面臨著前所未有
    的頭像 發(fā)表于 10-28 16:49 ?349次閱讀
    <b class='flag-5'>AI</b>大模型在智能座艙<b class='flag-5'>軟件</b><b class='flag-5'>測(cè)試</b>中的應(yīng)用與思考

    普華基礎(chǔ)軟件通過軟件能力成熟度5級(jí)認(rèn)證

    近日,普華基礎(chǔ)軟件正式通過軟件能力成熟度5級(jí)(CMMI DEV 3.0,Maturity Level 5)認(rèn)證,標(biāo)志著公司在軟件研發(fā)、項(xiàng)目管理、過程管理、量化管理、
    的頭像 發(fā)表于 08-28 17:23 ?766次閱讀

    Adobe在Illustrator和Photoshop設(shè)計(jì)軟件中引入新工具和生成性AI功能

    Vector AI模型,該模型近日已開始公開測(cè)試。 Adobe最新的Firefly Vector模型支持Illustrator的新功能,如Generative Shape Fill,允許用戶
    的頭像 發(fā)表于 07-29 17:10 ?912次閱讀

    MES里面有質(zhì)量模塊,為什么還要實(shí)施質(zhì)量管理軟件QMS

    ?為什么一些知名頭部的大廠,已經(jīng)有了MES , 卻還都去實(shí)施了質(zhì)量管理軟件(QMS)? 答:是這些MES里面的質(zhì)量模塊不能滿足客戶的需求。 ? 那么來看看,從質(zhì)量管理的角度來看,QMS
    的頭像 發(fā)表于 07-29 12:16 ?368次閱讀
    MES里面有<b class='flag-5'>質(zhì)量</b>模塊,為什么還要實(shí)施<b class='flag-5'>質(zhì)量管理軟件</b>QMS

    人機(jī)界面與組態(tài)軟件的區(qū)別

    涉及人與機(jī)器之間的交互,但它們?cè)?b class='flag-5'>功能、應(yīng)用場(chǎng)景、技術(shù)特點(diǎn)等方面存在著顯著的區(qū)別。本文將對(duì)人機(jī)界面和組態(tài)軟件的定義、功能以及它們之間的區(qū)別進(jìn)行詳細(xì)的探討和分析。
    的頭像 發(fā)表于 06-07 15:32 ?1062次閱讀

    上位機(jī)監(jiān)控軟件如何提高質(zhì)量

    。本文將從以下幾個(gè)方面詳細(xì)探討如何提高上位機(jī)監(jiān)控軟件質(zhì)量: 需求分析與設(shè)計(jì) 軟件架構(gòu)與模塊化 編程規(guī)范與代碼質(zhì)量 數(shù)據(jù)采集與處理 用戶界面
    的頭像 發(fā)表于 06-07 09:14 ?421次閱讀

    上位機(jī)可視化界面編程軟件有哪些

    上位機(jī)可視化界面編程軟件是一類用于開發(fā)圖形用戶界面(GUI)的軟件工具,它們通常提供了豐富的界面元素、易于使用的編程接口和強(qiáng)大的
    的頭像 發(fā)表于 06-06 10:48 ?2693次閱讀

    接口測(cè)試屬于功能測(cè)試嗎為什么

    的基本概念 在深入討論接口測(cè)試功能測(cè)試之前,我們需要了解軟件測(cè)試的基本概念。軟件
    的頭像 發(fā)表于 05-30 14:57 ?502次閱讀

    功能測(cè)試是白盒還是黑盒測(cè)試

    功能測(cè)試軟件測(cè)試的一種方法,主要用于驗(yàn)證軟件功能是否滿足需求規(guī)格說明書中的要求。
    的頭像 發(fā)表于 05-30 14:53 ?933次閱讀

    功能測(cè)試主要做什么 功能測(cè)試包含哪些測(cè)試

    功能測(cè)試軟件測(cè)試的一個(gè)重要組成部分,主要目的是驗(yàn)證軟件功能是否滿足需求規(guī)格說明書(SRS)中
    的頭像 發(fā)表于 05-29 16:05 ?5773次閱讀

    功能測(cè)試和接口測(cè)試的區(qū)別

    功能測(cè)試和接口測(cè)試軟件測(cè)試的兩個(gè)重要方面,它們?cè)诖_保軟件質(zhì)
    的頭像 發(fā)表于 05-29 16:02 ?986次閱讀

    功能測(cè)試和性能測(cè)試的區(qū)別與聯(lián)系

    功能測(cè)試和性能測(cè)試軟件測(cè)試的兩個(gè)重要方面。它們?cè)诖_保軟件質(zhì)
    的頭像 發(fā)表于 05-29 15:40 ?1114次閱讀

    仿真測(cè)試軟件測(cè)試的區(qū)別

    在當(dāng)今軟件開發(fā)和驗(yàn)證的領(lǐng)域中,測(cè)試保證軟件質(zhì)量的關(guān)鍵環(huán)節(jié)。而在測(cè)試的眾多方法中,仿真
    的頭像 發(fā)表于 05-17 14:33 ?960次閱讀

    潤(rùn)和軟件與華為昇騰AI完成兼容性測(cè)試認(rèn)證

    近日,江蘇潤(rùn)和軟件股份有限公司(以下簡(jiǎn)稱“潤(rùn)和軟件”)基于大模型的AI智能中樞平臺(tái)AIRUNS與華為昇騰通過相互兼容性測(cè)試認(rèn)證。經(jīng)過嚴(yán)格的聯(lián)
    的頭像 發(fā)表于 01-25 16:51 ?1177次閱讀