0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

峰會(huì)回顧第26期 | 知識(shí)驅(qū)動(dòng)的智能輔助開發(fā)研究與實(shí)踐

OpenHarmony TSC ? 來源:OpenHarmony TSC ? 作者:OpenHarmony TSC ? 2023-08-21 17:20 ? 次閱讀

演講嘉賓 | 彭 鑫

回顧整理 | 廖 濤

排版校對(duì) | 李萍萍

f7fdd574-4003-11ee-852b-dac502259ad0.png

嘉賓簡介

彭鑫,復(fù)旦大學(xué)計(jì)算機(jī)科學(xué)技術(shù)學(xué)院副院長、軟件學(xué)院副院長、教授、博士生導(dǎo)師,中國計(jì)算機(jī)學(xué)會(huì)軟件工程專委會(huì)副主任,主要研究方向包括軟件智能化開發(fā)與運(yùn)維、泛在計(jì)算軟件系統(tǒng)、智能網(wǎng)聯(lián)汽車等。獲得2016年NASAC青年軟件創(chuàng)新獎(jiǎng),多次獲得IEEE Transactions on Software Engineering年度最佳論文獎(jiǎng)、ACM SIGSOFT杰出論文獎(jiǎng)、IEEE TCSE杰出論文獎(jiǎng)等論文獎(jiǎng)項(xiàng)。

內(nèi)容來源

第一屆開放原子開源基金會(huì)OpenHarmony技術(shù)峰會(huì)——開發(fā)者工具分論壇

視頻回顧

打開 嗶哩嗶哩APP 搜索 OpenHarmony-TSC 視頻更清晰

正 文 內(nèi) 容

軟件開發(fā)是一個(gè)知識(shí)密集型活動(dòng),涉及API算法、業(yè)務(wù)知識(shí)、樣例代碼以及可復(fù)用庫等開發(fā)資源。然而,這些軟件開發(fā)知識(shí)和資源缺乏統(tǒng)一的規(guī)范化描述,難以被方便地獲取和復(fù)用。ChatGPT問世之前,學(xué)術(shù)界與工業(yè)界在智能輔助開發(fā)領(lǐng)域有哪些研究成果?ChatGPT爆火以后,我們又有哪些認(rèn)識(shí)和思考呢?復(fù)旦大學(xué)計(jì)算機(jī)科學(xué)技術(shù)學(xué)院副院長、軟件學(xué)院副院長,中國計(jì)算機(jī)學(xué)會(huì)軟件工程專委會(huì)副主任彭鑫在第一屆OpenHarmony技術(shù)峰會(huì)上分享了精彩觀點(diǎn)。

f829fa3c-4003-11ee-852b-dac502259ad0.png

智能輔助開發(fā)的一個(gè)典型場景是基于深度學(xué)習(xí)的代碼智能化推薦。以代碼大數(shù)據(jù)作為輸入,通過深度大模型訓(xùn)練,再基于訓(xùn)練結(jié)果進(jìn)行微調(diào)或提示,最終在端側(cè)實(shí)現(xiàn)代碼搜索、代碼推薦、代碼生成、注釋生成、缺陷預(yù)測和修復(fù)等能力。在ChatGPT火出圈之前,主要的代碼智能化推薦產(chǎn)品有Copilot和AlphaCode。其中,Copilot已經(jīng)實(shí)現(xiàn)了整函數(shù)和整方法的代碼推薦,AlphaCode在編程競賽中能夠達(dá)到人類能力的普遍水平。盡管ChatGPT的強(qiáng)大推薦和人機(jī)交互能力讓我們對(duì)AI和大數(shù)據(jù)深度學(xué)習(xí)產(chǎn)生了很多聯(lián)想,但目前大數(shù)據(jù)深度學(xué)習(xí)的思路仍存在一定的局限性。

f8617156-4003-11ee-852b-dac502259ad0.png

Copilot

目前,大數(shù)據(jù)深度學(xué)習(xí)的主要思路是追求更多的數(shù)據(jù)、更大的模型、更強(qiáng)的算力、更好的代碼表示方法、更多元的學(xué)習(xí)范式,以此獲得更好的學(xué)習(xí)效果。而針對(duì)軟件開發(fā)的本質(zhì)性困難(如:需求與設(shè)計(jì)的開放性和創(chuàng)造性問題、領(lǐng)域的多樣性和差異性問題等本質(zhì)困難),以及開發(fā)人員的理解和決策問題(如:開發(fā)人員如何針對(duì)推薦內(nèi)容進(jìn)行選擇、判斷、理解和消化,如何開展長期維護(hù))等方面,大數(shù)據(jù)深度學(xué)習(xí)可能并不是萬能的。大數(shù)據(jù)深度學(xué)習(xí)思路探討的根本問題,源于不同路線的選擇:(1)AI領(lǐng)域的端到端思路:根據(jù)輸入(功能描述)直接產(chǎn)生推薦結(jié)果(代碼片段或線性的代碼補(bǔ)全);(2)軟件工程領(lǐng)域的人機(jī)協(xié)作思路:適應(yīng)程序員的思考過程,從需求澄清到解決方案逐步精化,以交互的方式融入人的需求理解和經(jīng)驗(yàn)判斷。

軟件開發(fā)最大的浪費(fèi)是知識(shí)的浪費(fèi)、重復(fù)思考的浪費(fèi)。在實(shí)際的軟件開發(fā)過程中,我們經(jīng)常遇到如下場景:重復(fù)編寫的代碼、反復(fù)揣摩的設(shè)計(jì)意圖、重復(fù)犯過的錯(cuò)誤;它們(代碼)曾經(jīng)在腦海中浮現(xiàn)過、在交談?dòng)懻摵土奶煊涗浿谐霈F(xiàn)過,甚至曾經(jīng)被記錄過,但是無法在需要的時(shí)候出現(xiàn);文檔基本不可靠,要么過時(shí)要么從來沒有存在過等。從長期來看,如何深層次、系統(tǒng)性地解決智能化軟件開發(fā)問題呢?建立共建、共享,與代碼持續(xù)協(xié)同演化的軟件開發(fā)知識(shí)平臺(tái),能夠大幅提升軟件開發(fā)效率,保障代碼質(zhì)量,促進(jìn)軟件開發(fā)項(xiàng)目成員間的相互協(xié)作。例如,工業(yè)界“活文檔”的實(shí)踐上,實(shí)現(xiàn)了文檔知識(shí)和項(xiàng)目始終保持同步、文檔內(nèi)容簡短可理解以及文檔知識(shí)集體所有等功能;在學(xué)術(shù)界,也提出了按需生成文檔的思考,即基于各種結(jié)構(gòu)化和非結(jié)構(gòu)化軟件制品,通過知識(shí)抽取按需生成高質(zhì)量文檔。

f87ebbf8-4003-11ee-852b-dac502259ad0.png

f8d0a45e-4003-11ee-852b-dac502259ad0.png

軟件開發(fā)知識(shí)共享平臺(tái)實(shí)踐與思考

在ChatGPT問世之前,彭鑫教授所在團(tuán)隊(duì)基于知識(shí)思路的智能軟件開發(fā)已經(jīng)有相關(guān)嘗試和產(chǎn)品:

(1)API/軟件知識(shí)圖譜構(gòu)建:通過API文檔中的API功能、特性、使用指南與約束等,并輸入軟件代碼庫的API樣例、軟件開發(fā)問答網(wǎng)站的API討論等資源,結(jié)合通用知識(shí)圖譜的概念關(guān)系進(jìn)行語義標(biāo)注,形成API知識(shí)圖譜或軟件開發(fā)知識(shí)圖譜,開發(fā)端側(cè)軟件開發(fā)問答機(jī)器人等,以此輔助軟件開發(fā),提高開發(fā)效率;

f900eef2-4003-11ee-852b-dac502259ad0.png

f9238296-4003-11ee-852b-dac502259ad0.png

API知識(shí)以及API知識(shí)圖譜

(2)基于知識(shí)圖譜的代碼概念鏈接:通過將代碼段中的關(guān)鍵內(nèi)容建立概念鏈接,使開發(fā)者在軟件開發(fā)過程中,能夠便捷地了解到相關(guān)代碼的背景知識(shí);此外,基于概念鏈接,對(duì)搜索出的代碼列表提供多方面解釋,如概念解釋、概念關(guān)聯(lián)路徑以及補(bǔ)充建議等,還能夠幫助開發(fā)者理解和篩選所需的代碼片段;

f93cbe8c-4003-11ee-852b-dac502259ad0.png

代碼概念鏈接

(3)基于事理圖譜的代碼異常修復(fù):通常代碼異常可能由多種原因造成,基于開發(fā)者在開源社區(qū)上求助的代碼異常案例,抽取其求助目的、環(huán)境、代碼片段、異常癥狀以及報(bào)錯(cuò)棧等內(nèi)容,基于預(yù)訓(xùn)練語言模型進(jìn)行提示學(xué)習(xí),構(gòu)建事理圖譜,進(jìn)而實(shí)現(xiàn)通過交互式問答獲取異常報(bào)錯(cuò)相關(guān)信息,給出推薦的異常解決方案。

f95b0f68-4003-11ee-852b-dac502259ad0.png

事理知識(shí)圖譜

在智能軟件開發(fā)領(lǐng)域,ChatGPT具備代碼解釋、代碼生成以及代碼修復(fù)等能力,以人機(jī)對(duì)話的形式實(shí)現(xiàn)了多種智能化開發(fā)輔助功能,效果已經(jīng)超過了現(xiàn)有手段。ChatGPT的強(qiáng)大能力背后,是否存在一些問題和可能的改進(jìn)方向呢?彭鑫教授認(rèn)為有以下幾點(diǎn):

通過提供相關(guān)真實(shí)項(xiàng)目代碼、技術(shù)文檔、人類問答等論據(jù),增強(qiáng)推薦內(nèi)容的可信性

結(jié)合一些專用模型或“小數(shù)據(jù)”方法改進(jìn),提高長尾及冷啟動(dòng)問題回答的準(zhǔn)確性

將大模型與搜索引擎、知識(shí)圖譜等傳統(tǒng)信息和知識(shí)獲取方法相結(jié)合,緩解知識(shí)更新問題

在大模型的基礎(chǔ)上有機(jī)融入特定領(lǐng)域的軟件知識(shí)和代碼,從而支持特定領(lǐng)域軟件開發(fā)問題

在大模型的基礎(chǔ)上實(shí)現(xiàn)智能化的開發(fā)工具集成和反饋融合,讓工具具有面向軟件開發(fā)任務(wù)現(xiàn)場的“具身智能”

其中,特點(diǎn)領(lǐng)域/項(xiàng)目軟件開發(fā)知識(shí)平臺(tái)的開發(fā)是目前學(xué)術(shù)界和工業(yè)界的研究熱點(diǎn)。如何協(xié)同機(jī)器智能、代碼知識(shí)和專家知識(shí)呢?需要基于專家知識(shí)和代碼規(guī)范管理,建立與代碼雙向追蹤并同步演進(jìn)的代碼知識(shí)平臺(tái),探索以代碼為核心、適應(yīng)軟件開發(fā)特點(diǎn)的知識(shí)眾包模式。通過覆蓋實(shí)現(xiàn)、設(shè)計(jì)、需求等不同層面的代碼知識(shí)平臺(tái)實(shí)現(xiàn)系統(tǒng)性開發(fā)知識(shí)復(fù)用。此外,在軟件研發(fā)階段,通過建立基于DevOps流水線的軟件研發(fā)知識(shí)圖譜,能夠?qū)崿F(xiàn)特性、缺陷、測試用例等開發(fā)制品與代碼及其變更過程的全程追溯和基于知識(shí)的描述。

f992665c-4003-11ee-852b-dac502259ad0.png

f9b1b138-4003-11ee-852b-dac502259ad0.png

特定領(lǐng)域 / 項(xiàng)目軟件開發(fā)知識(shí)平臺(tái)

得益于軟件代碼及開發(fā)數(shù)據(jù)的大量積累和人工智能技術(shù)的發(fā)展,以及近期大模型和預(yù)訓(xùn)練模型方面取得的進(jìn)展,使智能化軟件工程研究與實(shí)踐成為熱點(diǎn)。但同時(shí),智能化軟件工程實(shí)踐落地需要充分考慮軟件工程實(shí)踐以及特定領(lǐng)域的特點(diǎn)。未來,大模型將成為智能化軟件開發(fā)的重要基礎(chǔ)設(shè)施,改變現(xiàn)有的知識(shí)獲取、抽取和利用方式;智能化輔助開發(fā)的主要問題變?yōu)槿绾卧陂_發(fā)任務(wù)現(xiàn)場與大模型之間建立高效的雙向交互管道;下一代IDE將成為融合軟件開發(fā)項(xiàng)目和任務(wù)上下文及開發(fā)工具的智能化軟件開發(fā)統(tǒng)一門戶。期待與大家一起關(guān)注人工智能和軟件工程領(lǐng)域相關(guān)進(jìn)展,共同貢獻(xiàn)國產(chǎn)化力量。

E N D

點(diǎn)擊下方閱讀原文獲取演講PPT。

關(guān)注我們,獲取更多精彩。

審核編輯 黃宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • OpenHarmony
    +關(guān)注

    關(guān)注

    25

    文章

    3744

    瀏覽量

    16466
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    明晚開播 |開源芯片系列講座26:奕斯偉RISC-V GCC工具鏈實(shí)踐分享

    鷺島論壇開源芯片系列講座26「奕斯偉RISC-VGCC工具鏈實(shí)踐分享」明晚(22日)20:00精彩開播期待與您云相聚,共襄學(xué)術(shù)盛宴!|直播信息報(bào)告題目奕斯偉RISC-VGCC工具鏈
    的頭像 發(fā)表于 01-21 08:04 ?12次閱讀
    明晚開播 |開源芯片系列講座<b class='flag-5'>第</b><b class='flag-5'>26</b><b class='flag-5'>期</b>:奕斯偉RISC-V GCC工具鏈<b class='flag-5'>實(shí)踐</b>分享

    直播預(yù)約 |開源芯片系列講座26:奕斯偉RISC-V GCC工具鏈實(shí)踐分享

    鷺島論壇開源芯片系列講座26「奕斯偉RISC-VGCC工具鏈實(shí)踐分享」1月22日(周三)20:00精彩開播期待與您云相聚,共襄學(xué)術(shù)盛宴!|直播信息報(bào)告題目奕斯偉RISC-VGCC工
    的頭像 發(fā)表于 01-14 09:52 ?163次閱讀
    直播預(yù)約 |開源芯片系列講座<b class='flag-5'>第</b><b class='flag-5'>26</b><b class='flag-5'>期</b>:奕斯偉RISC-V GCC工具鏈<b class='flag-5'>實(shí)踐</b>分享

    【「具身智能機(jī)器人系統(tǒng)」閱讀體驗(yàn)】1.初步理解具身智能

    重要。 書中還詳細(xì)介紹了支持具身智能機(jī)器人的核心技術(shù)系統(tǒng),包括自主機(jī)器人計(jì)算系統(tǒng)、感知系統(tǒng)、定位系統(tǒng)及規(guī)劃和控制系統(tǒng)。 本書共分5個(gè)部分。 1部分(1章和2章)介紹具身
    發(fā)表于 12-28 21:12

    迅為iTOP-RK3568開發(fā)驅(qū)動(dòng)開發(fā)指南-第十八篇 PWM

    期_SPI 第十七_串口 第十八期_PWM 第十九_RTC 第二十期_看門狗 未完待續(xù),持續(xù)更新中... 更新內(nèi)容 ◆教程更新 《iTOP-RK3568開發(fā)驅(qū)動(dòng)
    發(fā)表于 10-29 10:13

    AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》4章-AI與生命科學(xué)讀后感

    很幸運(yùn)社區(qū)給我一個(gè)閱讀此書的機(jī)會(huì),感謝平臺(tái)。 《AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》4章關(guān)于AI與生命科學(xué)的部分,為我們揭示了人工智能技術(shù)在生命科學(xué)領(lǐng)域中的廣泛應(yīng)用和
    發(fā)表于 10-14 09:21

    名單公布!【書籍評(píng)測活動(dòng)NO.44】AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新

    材料基因組工程的推動(dòng)下,人工智能如何與材料科學(xué)結(jié)合,加快傳統(tǒng)材料和新型材料的開發(fā)過程。 4章介紹了人工智能在加快藥物研發(fā)、輔助基因
    發(fā)表于 09-09 13:54

    2024 RISC-V 中國峰會(huì):華秋電子助力RISC-V生態(tài)!

    百家業(yè)界領(lǐng)先企業(yè)及頂尖研究機(jī)構(gòu)的專家學(xué)者,吸引了約3000名開發(fā)者、學(xué)者及行業(yè)精英親臨現(xiàn)場。在峰會(huì)前后,還策劃了超過20場豐富多彩的同期活動(dòng),為全球開發(fā)者提供了一個(gè)深入交流、碰撞思想、
    發(fā)表于 08-26 16:46

    名單公布!【書籍評(píng)測活動(dòng)NO.38】OpenHarmony開發(fā)實(shí)踐 | 基于紅莓RK2206開發(fā)

    移植,包括板級(jí)支持包(BSP)的開發(fā)和適配,以及外設(shè)驅(qū)動(dòng)開發(fā)和移植;5章介紹了OpenHarmony操作系統(tǒng)的IoT組件開發(fā),包括GPI
    發(fā)表于 07-19 10:57

    第二屆大會(huì)回顧22 軟件缺陷漏洞分析

    演講嘉賓 | 梁洪亮 回顧整理 | 廖? ?濤 排版校對(duì) | 宋夕明 嘉賓介紹 OS安全分論壇? 梁洪亮, 博士,北京郵電大學(xué)副教授,博士生導(dǎo)師。研究興趣為可信軟件與智能系統(tǒng)。 視頻回顧
    的頭像 發(fā)表于 06-27 08:42 ?392次閱讀
    第二屆大會(huì)<b class='flag-5'>回顧</b><b class='flag-5'>第</b>22<b class='flag-5'>期</b>  軟件缺陷漏洞分析

    【大語言模型:原理與工程實(shí)踐】探索《大語言模型原理與工程實(shí)踐》2.0

    《大語言模型“原理與工程實(shí)踐”》是關(guān)于大語言模型內(nèi)在機(jī)理和應(yīng)用實(shí)踐的一次深入探索。作者不僅深入討論了理論,還提供了豐富的實(shí)踐案例,幫助讀者理解如何將理論知識(shí)應(yīng)用于解決實(shí)際問題。書中的案
    發(fā)表于 05-07 10:30

    第二屆大會(huì)回顧13 | 以架構(gòu)為中心的開發(fā)者工具的核心技術(shù)與應(yīng)用

    演講嘉賓 | 晉武俠 回顧整理 | 廖? ?濤 排版校對(duì) | 李萍萍 嘉賓介紹 ?開發(fā)者工具分論壇? 晉武俠 ,西安交通大學(xué)軟件學(xué)院副教授。研究領(lǐng)域包括:代碼分析、軟件架構(gòu)治理、智能
    的頭像 發(fā)表于 02-25 17:59 ?805次閱讀
    第二屆大會(huì)<b class='flag-5'>回顧</b><b class='flag-5'>第</b>13<b class='flag-5'>期</b> | 以架構(gòu)為中心的<b class='flag-5'>開發(fā)</b>者工具的核心技術(shù)與應(yīng)用

    第二屆大會(huì)回顧12 | ClarifyGPT: 基于交互式需求澄清的大模型代碼生成框架

    演講嘉賓 | 石? ?琳 回顧整理 | 廖? ?濤 排版校對(duì) | 李萍萍 ? 嘉賓介紹 ?開發(fā)者工具分論壇? 石琳 ,北京航空航天大學(xué)軟件學(xué)院教授,CCF高級(jí)會(huì)員,2022年度中國科學(xué)院軟件研究
    的頭像 發(fā)表于 02-25 17:58 ?1294次閱讀
    第二屆大會(huì)<b class='flag-5'>回顧</b><b class='flag-5'>第</b>12<b class='flag-5'>期</b> | ClarifyGPT: 基于交互式需求澄清的大模型代碼生成框架

    第二屆大會(huì)回顧10 | 低時(shí)延分布式共享設(shè)備研究與探索

    演講嘉賓 | 杜? ?東 回顧整理 | 廖? ?濤 排版校對(duì) | 李萍萍 ? 嘉賓介紹 ?OS內(nèi)核及視窗分論壇? 杜東 ,上海交通大學(xué)助理研究員,OpenHarmony項(xiàng)目群技術(shù)指導(dǎo)委員會(huì)并發(fā)與協(xié)同
    的頭像 發(fā)表于 02-25 17:52 ?589次閱讀
    第二屆大會(huì)<b class='flag-5'>回顧</b><b class='flag-5'>第</b>10<b class='flag-5'>期</b> | 低時(shí)延分布式共享設(shè)備<b class='flag-5'>研究</b>與探索

    第二屆大會(huì)回顧14 | 矢量圖的高質(zhì)量重建與高效繪制

    訪問學(xué)者,中國計(jì)算機(jī)學(xué)會(huì)高級(jí)會(huì)員。主要從事計(jì)算機(jī)輔助設(shè)計(jì)與圖形學(xué)研究,已發(fā)表學(xué)術(shù)論文60余篇,主持參與多項(xiàng)國家自然科學(xué)基金項(xiàng)目、重點(diǎn)研發(fā)項(xiàng)目等。擔(dān)任CCF計(jì)算機(jī)輔助設(shè)計(jì)與圖形學(xué)專委會(huì)執(zhí)行委員,CSIAM幾何設(shè)計(jì)與計(jì)算專委會(huì)委員,
    的頭像 發(fā)表于 02-23 16:24 ?405次閱讀
    第二屆大會(huì)<b class='flag-5'>回顧</b><b class='flag-5'>第</b>14<b class='flag-5'>期</b> | 矢量圖的高質(zhì)量重建與高效繪制

    第二屆大會(huì)回顧8 | 智能終端OS的個(gè)人數(shù)據(jù)處理與保護(hù)

    CCF杰出會(huì)員。主要研究領(lǐng)域是操作系統(tǒng)與系統(tǒng)結(jié)構(gòu),研究興趣為通過軟硬協(xié)同設(shè)計(jì)增強(qiáng)計(jì)算機(jī)系統(tǒng)的安全性、隔離性與性能。與團(tuán)隊(duì)開發(fā)的系統(tǒng)包括:RISC-V平臺(tái)的可信執(zhí)行環(huán)境系統(tǒng)“蓬萊”,直通式進(jìn)程間調(diào)用硬件
    的頭像 發(fā)表于 02-21 11:52 ?457次閱讀
    第二屆大會(huì)<b class='flag-5'>回顧</b><b class='flag-5'>第</b>8<b class='flag-5'>期</b> | <b class='flag-5'>智能</b>終端OS的個(gè)人數(shù)據(jù)處理與保護(hù)