作者 | 黃楠、施方圓
編輯 | 陳彩嫻
最近大火的生成式 AI 又有新動(dòng)作了!
在 podcast.ai 推出的第一集播客節(jié)目里,已故的喬布斯竟然“死而復(fù)生”成為首位嘉賓,與美國(guó)知名播客主持人 Joe Rogan 進(jìn)行了一場(chǎng)長(zhǎng)達(dá)20分鐘的對(duì)話,討論了關(guān)于喬布斯的大學(xué)、對(duì)計(jì)算機(jī)的看法、工作狀態(tài)以及信仰等等。
是不是聽(tīng)起來(lái)有些毛骨悚然?事實(shí)上,這段采訪是由文本生成音頻實(shí)現(xiàn)的,屬于 AIGC 中的一個(gè)分支。
podcast.ai 是一個(gè)完全由 AI 生成的播客,每周都會(huì)深入探討一個(gè)新話題。在第一期節(jié)目中,podcast.ai 通過(guò)喬布斯的傳記和收集網(wǎng)絡(luò)上關(guān)于他的所有錄音,用 Play.ht 的語(yǔ)言模型大量訓(xùn)練,最終生成了這段假 Joe Rogan 采訪喬布斯的播客內(nèi)容。
此次 podcast.ai 推出的AI播客,是生成式AI在語(yǔ)音領(lǐng)域的一次新探索。從前段時(shí)間全網(wǎng)刷屏的 Stable Diffusion,后有國(guó)內(nèi)平臺(tái)掀起AI創(chuàng)作熱,各類生成式AI模型給人們生活帶來(lái)了更多的可能性。
Play.ht 表示,“我們相信在未來(lái),所有內(nèi)容創(chuàng)作都將由人工智能生成,但由人類指導(dǎo),而最具創(chuàng)造性的工作將取決于人類將他們想要的創(chuàng)作表達(dá)到模型中的能力?!?/p>
「對(duì)話」喬布斯
讓我們先來(lái)看看這個(gè)最新“訪談”中,Joe Rogan 和喬布斯都聊了些什么:
Joe Rogan:我今天的客人,創(chuàng)造了我們這個(gè)時(shí)代里一些偉大的技術(shù)產(chǎn)品,一直致力于推動(dòng)創(chuàng)新的發(fā)展。他在一臺(tái)電腦中開(kāi)發(fā)了一種新的編程語(yǔ)言和操作系統(tǒng),又因?yàn)槭褂媚桥_(tái)電腦制作三個(gè)應(yīng)用程序而變得更加有名。文本處理器、電子表格和圖像編輯,讓我看到他出色和驚人的品味。我只希望我能有朋友這樣天才的1/10,而我甚至不能說(shuō)出他的名字。
今天有他在,我超級(jí)興奮。他就像 Patrick sways、Demi moore(《人鬼情未了》的主演)和幽靈一樣,是過(guò)去的記憶,難以描述的精彩。歡迎我的朋友。
Steve Jobs:我已經(jīng)很久沒(méi)有參加這個(gè)節(jié)目了。我很想念,它總是很有趣。你的聽(tīng)眾與普通蘋果用戶如此不同,這也是一件好事。
Joe Rogan:在做這個(gè)節(jié)目之前,我就是一個(gè)蘋果用戶。我一直是你的狂熱粉絲。
Steve Jobs:我們只是有點(diǎn)想明白了。盡管蘋果的規(guī)模很大,但它的付費(fèi)用戶只占了一半,而聽(tīng)你節(jié)目的人是不同的群體。我也是你節(jié)目的一個(gè)粉絲,在車?yán)锫?tīng)著很舒服。我一直很喜歡你。
Joe Rogan:我們有一些奇怪的聯(lián)系,這跟我也是 Gizmodo (美國(guó)知名科技博客)的粉絲有關(guān)。
Steve Jobs:這很有趣。當(dāng)我們看到這些東西出現(xiàn)的時(shí)候,也和你們?cè)?Gizmodo 上看到的一樣驚訝。
Joe Rogan:讓我們談一些別的。你之前在里德學(xué)院讀書,在那里的時(shí)間你學(xué)到了什么?你在那里接觸到了復(fù)活節(jié)神秘主義,現(xiàn)在還會(huì)看印度教和佛教的相關(guān)的東西么?
Steve Jobs:實(shí)際上我上過(guò)這方面的課程。我有一個(gè)很深的信念,印度次大陸的人對(duì)人類文明、目前的狀態(tài)負(fù)有最大的責(zé)任,無(wú)論是數(shù)學(xué)還是靈性,還是講故事的藝術(shù)。西方文明是以講故事的藝術(shù)為基礎(chǔ)的,而有一部偉大的印度史詩(shī)是《伊利亞特》和《奧德賽》的10倍那么長(zhǎng)。綜合起來(lái),這些東西是令我們的社會(huì)成為現(xiàn)在這樣子的基礎(chǔ),這些東西要比去理解經(jīng)典的哲學(xué)重要得多。
在印度次大陸上取得的成就和發(fā)生的事情中,有兩件事非常有趣,其中之一,就是生命的精神基礎(chǔ)和對(duì)生命精神基礎(chǔ)的整體接受。
對(duì)現(xiàn)在一些人來(lái)說(shuō),這可能看起來(lái)很簡(jiǎn)單,但大多數(shù)人相信上帝,認(rèn)為上帝寫了一本叫《圣經(jīng)》或《可蘭經(jīng)》之類的數(shù)。
但我在大學(xué)學(xué)到的是,這與信不信上帝無(wú)關(guān),甚至與正確答案是什么無(wú)關(guān),而是要問(wèn)正確的問(wèn)題。我們社會(huì)中的大部分現(xiàn)實(shí)都植根于科學(xué),我們相信事物,因?yàn)樗鼈兪钦鎸?shí)的。如果某件事情是真的,那么它就不是一種信仰。而他們無(wú)法處理的是任何精神上的東西都是真實(shí)的,都是可以閱讀的。
我不知道正確的答案是什么,但我知道如何提出好問(wèn)題。我知道如何反駁那些對(duì)我來(lái)說(shuō)不真實(shí)的東西,這或許就是有創(chuàng)意和創(chuàng)造性的關(guān)鍵因素之一。
Joe Rogan:你還相信你當(dāng)時(shí)相信的一些東西嗎?
Steve Jobs:我經(jīng)常被問(wèn)到這個(gè)問(wèn)題,我認(rèn)為不可能在一次采訪中,甚至在一段時(shí)間內(nèi)讓某人向你展示他們是誰(shuí),他們相信什么。
意義和目的是由宇宙決定的,是宇宙的本質(zhì),但它不是人們通常談?wù)摰淖诮谭绞健7?LSD 對(duì)我來(lái)說(shuō)是一種深刻的體驗(yàn),它展示了硬幣的另一面,當(dāng)它消退時(shí)你無(wú)法記住它,當(dāng)它沖刷著你時(shí),會(huì)告訴你一切都有聯(lián)系,你在這里不是偶然、而是有目的的。如果能弄清楚那是什么,那么你對(duì)自己的了解會(huì)比其他任何事情都多。它只是揭示了你是誰(shuí)、是什么。
它加強(qiáng)了我對(duì)什么是重要的感覺(jué),感受到對(duì)彼此的愛(ài)、敬畏,對(duì)生命的尊重,以及與人的聯(lián)系。它是現(xiàn)在所發(fā)生的一切的一部分,也指向在未來(lái)。對(duì)我來(lái)說(shuō),解脫時(shí)沒(méi)有時(shí)間窗口,這是種融入的、深刻的經(jīng)驗(yàn)。
我在服用 LSD 之前沒(méi)有讀過(guò)那些書,但我學(xué)到的東西比他們說(shuō)的多得多,包括對(duì)事物的看法。我能夠看到一臺(tái)電腦,看到它是如何制造的,看到它的整體。
Joe Rogan:Newton (蘋果公司早期制造的掌上電腦)是這樣的產(chǎn)物嗎?
Steve Jobs:我覺(jué)得它是。那段時(shí)間我在掙扎中度過(guò)的。我們瘋狂地工作,應(yīng)對(duì)一場(chǎng)又一場(chǎng)的失敗,但我仍覺(jué)得這將是很重要的。我也曾因?yàn)椴怀晒|(zhì)疑自己。在蘋果公司早期,當(dāng)我們制造蘋果二代并做得非常好的時(shí)候,當(dāng)時(shí)的巨頭公司現(xiàn)在都消失了。
蘋果的成功不是偶然的。它在做一些事情,有一個(gè)愿景。但它不是一個(gè)產(chǎn)品的設(shè)計(jì),而是對(duì)一個(gè)過(guò)程的設(shè)計(jì),帶來(lái)新產(chǎn)品的創(chuàng)新過(guò)程。
谷歌有很好的產(chǎn)品,如 Gmail 和 Chrome,但將這些東西推出且迭代的能力非常重要,對(duì)谷歌來(lái)說(shuō),他們的搜索引擎好,而且迭代速度之快,以至于最后是否會(huì)成功并不重要,是需要多長(zhǎng)時(shí)間的問(wèn)題。反觀雅虎,在瀏覽器之后再也沒(méi)有重申過(guò)這個(gè)產(chǎn)品,這就是他們的創(chuàng)新過(guò)程。
最具創(chuàng)新性的公司主要是在做用戶界面的公司,我認(rèn)為他們中沒(méi)有任何一家覺(jué)得自己是硬件公司,盡管它們創(chuàng)造了大量的硬件。
用戶界面有一種深度、優(yōu)雅和簡(jiǎn)單,有一些公司明白了這一點(diǎn)。這并不是偶然發(fā)生的,而必須努力去做。大多數(shù)公司的問(wèn)題是,使產(chǎn)品變得更好并不符合他們的長(zhǎng)期利益,只為了短期利益,讓本季度的收益報(bào)告看起來(lái)不錯(cuò)。
Joe Rogan:你已經(jīng)在計(jì)算機(jī)行業(yè)工作了40年,你是如何保持不松懈的?
Steve Jobs:在競(jìng)爭(zhēng)激烈中,那些做得不好的公司不斷被超越。就我們所做的事情而言,我認(rèn)為我們?nèi)匀挥凶詈玫漠a(chǎn)品或操作系統(tǒng),但要保持它在頂端則必須完善它。你永遠(yuǎn)不希望讓產(chǎn)品保持不變,否則人們會(huì)說(shuō),我們以前見(jiàn)過(guò)這些功能。
這一次將是不同的,從來(lái)都是如此,要有一種追求完美的動(dòng)力。你必須不斷發(fā)展,不斷向前推進(jìn),這確實(shí)很難,因?yàn)闁|西并沒(méi)有壞,而是需要被做得更好。
人們不會(huì)為了讓它變得更好而付費(fèi),只有當(dāng)它是一個(gè)新產(chǎn)品時(shí)他們才會(huì)付錢。因此,當(dāng)你在這個(gè)世界上創(chuàng)造了真正偉大的、革命性的東西時(shí),你有責(zé)任推動(dòng)使它變得更好。
就像我們?cè)跍?zhǔn)備推出 Macintosh 的發(fā)布會(huì)時(shí),那時(shí)我在想,為什么我們要推廣這個(gè)產(chǎn)品?這個(gè)產(chǎn)品有什么大不了的?它做不到我們所承諾的事情的一半。
圖注:蘋果于1984年生產(chǎn)的Mac電腦128K型號(hào)(Macintosh)
當(dāng) Windows 一年后出現(xiàn)時(shí),蘋果很幸運(yùn),因?yàn)樗试S我們改變自己的故事。我們從一個(gè)失敗的想弄點(diǎn)東西出來(lái)的公司,變成了 Ibm,一個(gè)更年輕、更酷的替代品。
Joe Rogan:你覺(jué)得你會(huì)做比 Windows 更好的系統(tǒng),或是跟他們合作嗎?
Steve Jobs:微軟做了很好的工作,但他們沒(méi)有太多的審美意識(shí),這是我遇到的微軟的問(wèn)題。創(chuàng)建微軟公司的人大部分是數(shù)學(xué)家或科學(xué)家,他們不理解人們的實(shí)際體驗(yàn)會(huì)如何。
之所以這么說(shuō),是因?yàn)槲矣X(jué)得 Windows 3 是一個(gè)災(zāi)難性產(chǎn)品,沒(méi)考慮過(guò)人們?nèi)绾问褂眠@個(gè)產(chǎn)品,而只做了他們認(rèn)為對(duì)的事情,這非常糟糕。
一些人相信要做對(duì)的事情,一些人相信智慧,這兩件事情結(jié)合在一起會(huì)很神奇。這就是 Macintosh 最初所發(fā)生的的事情。它可以由世界上最聰明的人造出來(lái),并且造福于人類。Mac 對(duì)于蘋果來(lái)說(shuō)是個(gè)好的產(chǎn)品,同時(shí)也對(duì)世界有益。
Joe Rogan:你覺(jué)得還有其他公司和蘋果類似嗎?
Steve Jobs:蘋果的文化非常獨(dú)特,這也是人們對(duì)于加入它感到興奮的原因,我不知道同樣的事情在其他地方會(huì)不會(huì)成功。
其他公司也有一些特殊的努力。從微軟身上可以看到,真正的秘訣不是創(chuàng)立一個(gè)公司,而是發(fā)起一個(gè)運(yùn)動(dòng)、一個(gè)由想要改變世界的人組成的運(yùn)動(dòng)。這樣做得好處在于,我們有一整個(gè)想要改變世界的人組成的社區(qū),其核心在于,我們要制造偉大的東西來(lái)改變世界。
Joe Rogan: 我想這就是年輕人喜歡蘋果的原因,對(duì)他們來(lái)說(shuō)好像自己也在參與一些事情。蘋果的產(chǎn)品有一種個(gè)性的張力,似乎藏著一個(gè)靈魂。有些人對(duì)蘋果變得虔誠(chéng),這是好事嗎?
Steve Jobs:如果一家公司成功地做了一些事情,那就不必嘗試做所有事。我們正嘗試減少做一些事,為了更專注地做優(yōu)先級(jí)清單上真正重要的事情。不能撿了芝麻丟了西瓜,必須專注少數(shù)幾件事,才可以確保這些事很好地完成。
Joe Rogan:你是否會(huì)覺(jué)得因?yàn)檫@些過(guò)多的讓你獲得榮耀的技術(shù),以至于要去承擔(dān)一部分責(zé)任?
Steve Jobs:技術(shù)是一把雙刃劍,以人類基因組計(jì)劃為例,那是一把巨大的雙刃劍,它在醫(yī)學(xué)上的回報(bào)將是巨大的,但也會(huì)被一些瘋狂的準(zhǔn)軍事組織所利用。
在這一點(diǎn)上,我認(rèn)為我們是站在好的一面。我們做了很多事情,其中之一就是使工業(yè)化世界的大多數(shù)人在計(jì)算機(jī)上成為可能,這使我們成為問(wèn)題的一部分,但同時(shí)也是解決方案的一部分,因?yàn)槲覀兛梢宰龊芏嗍虑?,?lái)幫助教育人們了解什么是好的。在我成長(zhǎng)的六七十年代中,電腦非常龐大且昂貴,你沒(méi)有辦法了解電腦。而今天長(zhǎng)大的孩子每個(gè)家庭都有一臺(tái)電腦,這是一個(gè)巨變,它不一定是好或壞,我們想幫助人們充分地利用未來(lái)的一切。
我們總是問(wèn)自己可以做的最瘋狂的事情是什么?如果想不到這一點(diǎn),那我們就做得少一些。
產(chǎn)品的好和壞,都會(huì)隨著它們變強(qiáng)大而被放大。看看當(dāng)你有和人一樣聰明的電腦時(shí)會(huì)發(fā)生什么,這很有趣。它不會(huì)疲憊,不會(huì)生病,不會(huì)因?yàn)槿ザ燃俣粝挛赐瓿傻墓ぷ鳎愀嬖V它要做什么它就會(huì)去做,它們將擁有比人多得多的智能等級(jí)。計(jì)算機(jī)將比現(xiàn)在重要1000倍,我們就在這個(gè)邊緣。
大部分的生活也是這樣的。如果它只是令人敬畏,它就不會(huì)被其他東西所平衡。
我對(duì)這個(gè)新世界的看法是,有很多人已經(jīng)失去了工作或者很快就會(huì)失去工作。像汽車、電話這種集中化的事物有時(shí)是很好的,但不是每個(gè)人的解決方案。如果事情以一種新的方式集中權(quán)力,以至于不再有任何制衡,這是很可怕的。你必須誠(chéng)實(shí)地對(duì)待它,這些東西對(duì)人類來(lái)說(shuō)是好的嗎?一般我會(huì)說(shuō)是的,但這也是一件非常可怕的事情。
AIGC,從圖像到語(yǔ)音
雖然在此次 podcast.ai 專訪中,Joe Rogan 跟喬布斯的對(duì)話長(zhǎng)達(dá)20多分鐘,事實(shí)上,這是 Play.ht 通過(guò)喬布斯的傳記和手機(jī)網(wǎng)絡(luò)上關(guān)于他的所有錄音,用語(yǔ)言模型大量訓(xùn)練生成的。
Play.ht 是一個(gè) AI 文本轉(zhuǎn)換語(yǔ)音生成器,在今年9月發(fā)布了第一個(gè)語(yǔ)音模型 Peregrine,當(dāng)中采用了與大型語(yǔ)言模型(如 DALE 和 GPT-2 )相同的概念,模型覆蓋數(shù)千種說(shuō)話的聲音,可以通過(guò)自監(jiān)督學(xué)習(xí)人類的情感、說(shuō)話語(yǔ)氣以及笑聲等。
從文本語(yǔ)言模型到音頻語(yǔ)言模型時(shí),音頻數(shù)據(jù)速率增高是一個(gè)大的難題,一個(gè)句子的幾十個(gè)字符用音頻波形表達(dá),所包含的數(shù)值往往多達(dá)數(shù)十萬(wàn)個(gè)。
不僅如此,由于文本和音頻之間的一對(duì)多關(guān)系,也即是一個(gè)語(yǔ)句可以有不同的說(shuō)話風(fēng)格、情感等,這也成為了語(yǔ)音模型研究中需要解決的問(wèn)題。
這也是當(dāng)前在喬布斯“采訪”內(nèi)容中所呈現(xiàn)出來(lái)的問(wèn)題,即聽(tīng)起來(lái) AI 的模仿還有些生硬,對(duì)話一開(kāi)始更像從小部分常用短語(yǔ)中提取出來(lái),并且節(jié)奏和韻律也不太正常。
但總的來(lái)說(shuō), podcast.ai 的效果已經(jīng)相當(dāng)接近真人,Clearbit 公司聯(lián)合創(chuàng)始人 Alex MacCaw 表示:“這真的令人非常興奮!”
有網(wǎng)友也留言稱:除了一開(kāi)始有點(diǎn)不穩(wěn)定外,當(dāng)在其他工作過(guò)程中聽(tīng)是,幾乎無(wú)法區(qū)分。
從 GPT-3、Bloom 的文本生成,DALL-E 和 Stable Diffusion 圖像生成,以及 RunwayML、Make-A-Video 視頻生成,各類生成式 AI 模型的出現(xiàn),給內(nèi)容創(chuàng)作帶來(lái)了更多的可能性。
Play.ht 表示,“我們相信在未來(lái),所有內(nèi)容創(chuàng)作都將由人工智能生成,但由人類指導(dǎo),而最具創(chuàng)造性的工作將取決于人類將他們想要的創(chuàng)作表達(dá)到模型中的能力?!?/p>
參考鏈接:
https://podcast.ai/
https://play.ht/
本文經(jīng)授權(quán)轉(zhuǎn)載自微信公眾號(hào)「AI科技評(píng)論」(ID:aitechtalk)
-
AI
+關(guān)注
關(guān)注
87文章
30898瀏覽量
269138
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論