0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

不卷自研大模型,金山辦公如何創(chuàng)新生成式AI?

科技云報到 ? 來源:jf_60444065 ? 作者:jf_60444065 ? 2023-11-06 22:37 ? 次閱讀

科技云報道原創(chuàng)。

過去大半年里,很多人對大模型的前景寄予厚望。主流觀點認為,每個行業(yè)、每款產(chǎn)品都可以通過大模型“重做一遍”。

“重做一遍”聽起來想象空間很大,但實際上多數(shù)大模型產(chǎn)品需要漫長的訓練周期和海量資源投入,落地也就變得遙遙無期。

今年年初金山辦公宣布All in AI,將LLM能力全面引入產(chǎn)品,發(fā)布基于大語言模型的智能辦公助手WPS AI。

相較于大模型玩家普遍把“重做一遍”視為創(chuàng)新路徑時,WPS AI帶來了另一種大模型創(chuàng)新方法論——與其“重做一遍”,不如去“重新發(fā)現(xiàn)”。

據(jù)悉,金山辦公選擇在大模型應用側(cè)下功夫,WPS國內(nèi)版與WPS海外版同時推進WPS AI研發(fā)落地,讓每個模型都能充分發(fā)揮自身的優(yōu)勢。

正因如此,WPS AI甚至比微軟的Microsoft 365 Copilot還快了一步,成了國內(nèi)第一個將大語言模型(LLM)應用在辦公軟件領(lǐng)域,并真正交付了可用產(chǎn)品的公司

自今年4月18日首次亮相以來,WPS AI在短短50天里對多個核心辦公場景進行了賦能,用“金山速度”不斷刷新著生成式AI的應用邊界。

如此驚人的進化速度,WPS AI是如何實現(xiàn)的?

生成式AI的背后是大模型服務(wù)的支撐

如果你是WPS的用戶,最近可能會觀察到一些變化:金山文檔「智能文檔」的新功能已經(jīng)能夠幫你提供新聞稿、廣告文案、教學教案、工作周報等種種文件的起草、改寫、總結(jié)、潤色、翻譯、續(xù)寫等功能。

除此之外,它還可以幫你一鍵生成幻燈片、一鍵分析Excel數(shù)據(jù)、翻譯總結(jié)文檔,自己寫日報等等。

通過AI大模型,WPS構(gòu)建出一個更高效、快捷釋放場景能力的智能交互系統(tǒng),去解決用戶多元且碎片化的辦公需求。

不可否認,生成式AI本身的能力非常驚艷,但是生成式AI遠遠不只是以模型和AI這么簡單。

基礎(chǔ)模型只是在海面上的冰山一角,為了支持好這個冰山一角,冰川的底部有多個服務(wù)來支撐,比如說加速芯片、存儲優(yōu)化、數(shù)據(jù)庫、大數(shù)據(jù)分析、安全服務(wù)等等。

不僅如此,支撐生成式AI的每一種技術(shù)和基礎(chǔ)設(shè)施環(huán)境,都在發(fā)生著快速變化。

以基礎(chǔ)模型為例,其發(fā)展是按照月甚至按照天的速度來迭的。2019年,最大的預訓練模型是3.3億個參數(shù),但到了2023年,大模型最大的參數(shù)已經(jīng)超過了五千億個,也就是說短短四年,整個參數(shù)的迭代超過了1600倍。

同時,國內(nèi)外都掀起了“百模大戰(zhàn)”,從最開始出現(xiàn)的Transformer,到去年的GPT3.5、Stable Diffusion,再到今天GPT4、Llama2、Claude2等模型,還包括國內(nèi)正在自研的基礎(chǔ)模型如百川、ChatGLM等,每個模型都具備著他們自己獨有的場景和優(yōu)勢。

正如亞馬遜云科技的CEO Adam Selipsky所說,沒有一個基礎(chǔ)模型可以適用于所有的業(yè)務(wù)場景,用戶會根據(jù)自己的場景去選擇最適合自己的基礎(chǔ)模型。

這一點放在金山辦公身上同樣適用。

金山辦公AI研發(fā)總監(jiān)劉強在采訪中表示,幾乎很少有一個模型能涵蓋全部的能力,通常一個功能需要多個模型協(xié)作,需要考慮不同模型之間的調(diào)用方式不一樣。

但Amazon Bedrock的模型管理,能把不同大模型底層的API做成透明統(tǒng)一的,這減輕了很大的工作量。

wKgZomVI-d2AP4xoAATGCFVkR0c199.png

金山辦公AI研發(fā)總監(jiān) 劉強

劉強提到的Amazon Bedrock,是亞馬遜云科技今年4月發(fā)布的一項生成式AI重要產(chǎn)品。

它支持來自AI21 Labs、Anthropic、Cohere、Meta、Stability AI 和Amazon等領(lǐng)先人工智能公司的高性能基礎(chǔ)模型,并可以輕松安全地進行自定義模型訓練。

作為國內(nèi)第一批Amazon Bedrock的預覽版用戶,金山辦公可以在輕松使用這些高性能基礎(chǔ)模型的同時,也能夠使用自己的數(shù)據(jù)構(gòu)建差異化的應用程序。

與此同時,金山辦公通過使用機器學習平臺Amazon SageMaker,正在幫助算法科學家快速進行場景實驗和算法迭代。

Amazon SageMaker不僅可以避免算法科學家從頭搭建模型,還可以通過Amazon SageMaker JumpStart功能幫助客戶快速構(gòu)建和部署模型,從而嘗試多種開源模型。

可以說,有了這類大模型管理作為基礎(chǔ)服務(wù)作為支撐,生成式AI的應用創(chuàng)新事倍功半。

生成式AI要效率也要安全合規(guī)

隨著大模型的發(fā)展,數(shù)據(jù)的合規(guī)性和安全性成為亟待解決的問題。

在生成式AI領(lǐng)域中,數(shù)據(jù)的獲取、加工及利用的方式?jīng)Q定了模型的性能和準確性。數(shù)據(jù)的非法泄漏、被惡意篡改,可能導致訓練出的模型有誤導性;非法獲取或使用未經(jīng)授權(quán)的數(shù)據(jù),不僅違法,還可能使得模型偏離了其原本的目的。

前段時間,OpenAI被指控訓練ChatGPT時使用從互聯(lián)網(wǎng)上抓取的數(shù)據(jù),大規(guī)模侵犯了無數(shù)人的版權(quán)和隱私。目前全球各國對于企業(yè)使用大模型的數(shù)據(jù)安全要求已日益提升。

不少企業(yè)在構(gòu)建大模型時也普遍要求私有化部署,即在加密環(huán)境中使用私有數(shù)據(jù)訓練模型,以控制相關(guān)數(shù)據(jù)和模型的安全風險。

金山辦公AI研發(fā)總監(jiān)劉強表示,WPS非常重視數(shù)據(jù)安全,有專業(yè)的團隊及合作伙伴共同打造完善的數(shù)據(jù)安全體系,在各個國家和地區(qū)可以有效的保障用戶隱私。

正因?qū)Π踩弦?guī)的重視,金山辦公作為一家中國企業(yè)得以順利走向全球。截至2022年底,WPS在海外已擁有超過1億活躍用戶,WPS Office累計獲得近4億次安裝。

從與金山辦公合作的亞馬遜云科技大模型服務(wù)來看,Amazon Bedrock在安全合規(guī)方面也助力頗多。

據(jù)亞馬遜云科技解決方案架構(gòu)師介紹,在開發(fā)之初就考慮到安全性和隱私保護,幫助客戶保護敏感數(shù)據(jù):

首先,Amazon Bedrock從服務(wù)設(shè)計層面就確保了客戶的數(shù)據(jù)以及客戶相關(guān)的信息不會被用于進一步訓練模型。所有的客戶數(shù)據(jù)都是經(jīng)過加密的,且只有客戶能夠訪問。

其次,客戶可以使用Amazon PrivateLink,在Amazon Bedrock與虛擬私有網(wǎng)絡(luò)(VPC)之間建立專門的安全連接,確保任何數(shù)據(jù)傳輸都不會暴露在公共網(wǎng)絡(luò)。

最后,對于存在高度監(jiān)管需求的客戶,Amazon Bedrock符合 HIPAA(《健康保險流通與責任法案》)要求,并且可以在 GDPR(歐盟《通用數(shù)據(jù)保護條例》)合規(guī)標準下使用,讓更多的客戶從生成式AI中獲益。

不難發(fā)現(xiàn),金山辦公也可以利用它有效提升安全合規(guī)工作的效率,并確??蛻魯?shù)據(jù)的安全性,讓金山辦公的實力得以在海外充分釋放。

構(gòu)建生成式AI需要高性價比的基礎(chǔ)設(shè)施

正如前文所說,開發(fā)生成式AI應用是一個充滿挑戰(zhàn)的系統(tǒng)工程,并不是單純的產(chǎn)品和服務(wù)拼接,需要各種技術(shù)和工具來解決挑戰(zhàn),而高性價比的基礎(chǔ)設(shè)施正是其強有力的支撐。

早在生成式AI創(chuàng)新之前,金山辦公就在積極探尋如何利用AI/ML技術(shù)為業(yè)務(wù)賦能。在數(shù)據(jù)存儲、現(xiàn)代化應用開發(fā)、AI/ML、芯片等層面,金山辦公與亞馬遜云科技都有深度合作。

例如,WPS Office通過使用Amazon S3高效低成本地實現(xiàn)了PB級海量數(shù)據(jù)存儲。

通過Amazon S3的智能分層功能,在存儲方面獲得了40%以上的成本優(yōu)化效果;利用亞馬遜云科技在美國、日本和印度的節(jié)點,將終端用戶的響應延遲從日常大于1秒減少穩(wěn)定至500毫秒以下。

在構(gòu)建精細化運營方面,金山辦公基于機器學習平臺Amazon SageMaker服務(wù)構(gòu)建了從用戶識別、用戶轉(zhuǎn)換到流失用戶挽回的一整套用戶精細化運營路徑,通過人工智能預測用戶購買,增強用戶轉(zhuǎn)化率。

除此之外,金山辦公還在嘗試利用亞馬遜提供的GPU機型和為生成式AI而打造的專門構(gòu)建的加速芯片(Amazon Inferentia和Amazon Trainium),為海外業(yè)務(wù)部署開源模型方案,并且嘗試利用加速芯片來降低成本。

總的來說,避免重復開發(fā)大模型,專注于模型的開發(fā)效率、調(diào)優(yōu)以及對底層基礎(chǔ)設(shè)施的高效利用,金山辦公為AI應用帶來了新的研發(fā)方式,也為AI應用開發(fā)者值得借鑒的思路。

未來,金山辦公還將以AIGC(內(nèi)容創(chuàng)作)、Copilot(智慧助理)和Insight(知識洞察)三個戰(zhàn)略方向為核心,掀起辦公交互方式的新一輪變革。

【關(guān)于科技云報道】

專注于原創(chuàng)的企業(yè)級內(nèi)容行家——科技云報道。成立于2015年,是前沿企業(yè)級IT領(lǐng)域Top10媒體。獲工信部權(quán)威認可,可信云、全球云計算大會官方指定傳播媒體之一。深入原創(chuàng)報道云計算、大數(shù)據(jù)、人工智能、區(qū)塊鏈等領(lǐng)域。

審核編輯 黃宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    31429

    瀏覽量

    269827
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    2524

    瀏覽量

    2994
收藏 人收藏

    評論

    相關(guān)推薦

    基于Arm Neoverse平臺的處理器革新生成AI體驗

    Llama 是一個專為開發(fā)者、研究人員和企業(yè)打造的開源大語言模型 (LLM) 庫,旨在推動生成 AI創(chuàng)新、實驗及可靠地擴展。
    的頭像 發(fā)表于 01-03 15:31 ?203次閱讀
    基于Arm Neoverse平臺的處理器革<b class='flag-5'>新生成</b><b class='flag-5'>式</b><b class='flag-5'>AI</b>體驗

    Google兩款先進生成AI模型登陸Vertex AI平臺

    新的 AI 模型,包括最先進的視頻生成模型Veo以及最高品質(zhì)的圖像生成模型Imagen 3。近日
    的頭像 發(fā)表于 12-30 09:56 ?112次閱讀

    中國電信發(fā)布視頻生成模型

    ,中國電信隆重發(fā)布了首個由央企全的視頻生成模型。該模型采用了創(chuàng)新的“VAST(Video
    的頭像 發(fā)表于 12-13 15:40 ?216次閱讀

    WPS升級推出智能公文,搭載政務(wù)AI模型

    智能公文系統(tǒng)搭載了金山辦公的政務(wù)模型,該模型針對政務(wù)公文的特點和需求進行了深度優(yōu)化,能夠為用
    的頭像 發(fā)表于 11-28 10:35 ?290次閱讀

    NVIDIA推出全新生成AI模型Fugatto

    NVIDIA 開發(fā)了一個全新的生成 AI 模型。利用輸入的文本和音頻,該模型可以創(chuàng)作出包含任意的音樂、人聲和聲音組合的作品。
    的頭像 發(fā)表于 11-27 11:29 ?407次閱讀

    字節(jié)跳動視頻生成模型Seaweed開放

    近日,字節(jié)跳動旗下的AI內(nèi)容平臺即夢AI傳來新消息,宣布的視頻生成模型Seaweed即日起正
    的頭像 發(fā)表于 11-11 14:31 ?284次閱讀

    如何用C++創(chuàng)建簡單的生成AI模型

    生成AI(Generative AI)是一種人工智能技術(shù),它通過機器學習模型和深度學習技術(shù),從大量歷史數(shù)據(jù)中學習對象的特征和規(guī)律,從而能夠
    的頭像 發(fā)表于 07-05 17:53 ?956次閱讀

    生成AI與神經(jīng)網(wǎng)絡(luò)模型的區(qū)別和聯(lián)系

    生成AI與神經(jīng)網(wǎng)絡(luò)模型是現(xiàn)代人工智能領(lǐng)域的兩個核心概念,它們在推動技術(shù)進步和應用拓展方面發(fā)揮著至關(guān)重要的作用。本文將詳細探討生成
    的頭像 發(fā)表于 07-02 15:03 ?894次閱讀

    金山辦公發(fā)布WPS AI海外版,應用亞馬遜云科技生成AI技術(shù)

    金山辦公近日在海外市場邁出了重要一步,正式發(fā)布了WPS AI海外版。這款全新的人工智能應用,不僅展示了金山辦公在智能
    的頭像 發(fā)表于 06-20 10:43 ?599次閱讀

    微軟AI模型即將問世

    微軟正悄然醞釀一項重大技術(shù)突破,據(jù)內(nèi)部消息人士透露,公司正全力訓練一款名為“MAI-1”的人工智能大模型。這款模型備受期待,其規(guī)模龐大,足以與谷歌的Gemini和OpenAI的Ch
    的頭像 發(fā)表于 05-07 14:46 ?510次閱讀

    生成 AI 進入模型驅(qū)動時代

    隨著ChatGPT和大型語言模型(LLM)呈現(xiàn)爆炸增長,生成人工智能(GenerativeAI)成為近來的一大熱詞。由此引發(fā)了一場爭論:哪種AI
    的頭像 發(fā)表于 04-13 08:12 ?564次閱讀
    <b class='flag-5'>生成</b><b class='flag-5'>式</b> <b class='flag-5'>AI</b> 進入<b class='flag-5'>模型</b>驅(qū)動時代

    聯(lián)想攜手京東,緊扣大模型生成AI技術(shù)

    聯(lián)想與京東攜手,緊扣大模型生成AI技術(shù)帶來的產(chǎn)業(yè)機遇,在多個領(lǐng)域展開深入合作。
    的頭像 發(fā)表于 04-12 10:27 ?665次閱讀

    商湯科技與金山辦公合作打造的辦公新質(zhì)生產(chǎn)力平臺WPS 365

    4月9日,在金山辦公生產(chǎn)力大會上,金山辦公展示了攜手商湯科技等國內(nèi)大模型廠商打造的辦公新質(zhì)生產(chǎn)力
    的頭像 發(fā)表于 04-11 14:23 ?484次閱讀
    商湯科技與<b class='flag-5'>金山</b><b class='flag-5'>辦公</b>合作打造的<b class='flag-5'>辦公</b>新質(zhì)生產(chǎn)力平臺WPS 365

    理想汽車模型Mind GPT通過國家備案

    理想汽車近日宣布,其全的多模態(tài)認知大模型Mind GPT已正式通過國家《生成人工智能服務(wù)管理暫行辦法》備案,成為汽車行業(yè)中首個成功通過
    的頭像 發(fā)表于 03-29 11:05 ?625次閱讀

    萬事達卡推出欺詐檢測AI模型

    全球領(lǐng)先的支付技術(shù)公司萬事達卡(MasterCard)近日宣布推出其生成AI模型“De
    的頭像 發(fā)表于 02-05 10:34 ?1212次閱讀