Redis之父的大語(yǔ)言模型編程實(shí)踐

作者 | Antirez? ? ? ? ?

首先我要明確，這篇文章并不旨在回顧大語(yǔ)言模型。顯而易見(jiàn)，2023 年對(duì)人工智能來(lái)說(shuō)是不平凡的一年，再去強(qiáng)調(diào)這一點(diǎn)似乎沒(méi)有多大必要。這篇文章更多是作為一位程序員的個(gè)人體驗(yàn)分享。

自從 ChatGPT 出現(xiàn)，再到使用本地運(yùn)行的大語(yǔ)言模型，我就開(kāi)始廣泛應(yīng)用這項(xiàng)新技術(shù)。我的目標(biāo)不僅僅是提高編碼效率，更重要的是，我不想在編程中那些無(wú)需過(guò)多精力投入的地方浪費(fèi)時(shí)間。不愿意花費(fèi)大量時(shí)間去查找某些專業(yè)且無(wú)趣的文檔，不想為了學(xué)習(xí)一些過(guò)于復(fù)雜且往往無(wú)需如此的 API 而勞心費(fèi)力，也不想編寫那些幾小時(shí)后就會(huì)被我拋棄的臨時(shí)代碼。尤其是如今 Google 成了一個(gè)充斥著垃圾信息的海洋，我們只能在其中努力尋找那少數(shù)有用信息。

同時(shí)，我也不是編程領(lǐng)域的新手。我完全有能力在沒(méi)有任何輔助的情況下編寫代碼，而且我也常常這么做。隨著時(shí)間的推移，我越來(lái)越頻繁地借助大語(yǔ)言模型來(lái)編寫高級(jí)代碼，特別是 Python 代碼，而在 C 語(yǔ)言方面則相對(duì)少一些。在體驗(yàn)大語(yǔ)言模型的過(guò)程中，我深刻認(rèn)識(shí)到，應(yīng)該在何時(shí)使用它們，以及何時(shí)它們的使用反而會(huì)拖慢我的步伐。我還了解到，大語(yǔ)言模型有點(diǎn)類似于維基百科和 YouTube 上琳瑯滿目的視頻課程：它們對(duì)那些有意愿、有能力和自律的人大有裨益，但對(duì)于其他人來(lái)說(shuō)，幫助有限。我擔(dān)心，至少在初始階段，它們更多的是惠及那些本就占據(jù)優(yōu)勢(shì)的人。但我們還是一步一個(gè)腳印來(lái)吧！

全知全能還是鸚鵡學(xué)舌？ ? 在機(jī)器學(xué)習(xí)新浪潮中，最讓人擔(dān)憂的是 AI 專家們難以接受自己知識(shí)的局限性。人類發(fā)明了神經(jīng)網(wǎng)絡(luò)，更關(guān)鍵的是，還發(fā)明了一個(gè)自動(dòng)優(yōu)化神經(jīng)網(wǎng)絡(luò)參數(shù)的算法。隨著硬件能力的提升，能夠訓(xùn)練更大的模型，利用數(shù)據(jù)的統(tǒng)計(jì)知識(shí)（即先驗(yàn)知識(shí)），通過(guò)不斷的嘗試和錯(cuò)誤，逐漸找到了一些比其他架構(gòu)更有效的模型設(shè)計(jì)。但不管怎樣，神經(jīng)網(wǎng)絡(luò)本質(zhì)上還是相當(dāng)復(fù)雜且不透明的。

面對(duì)大語(yǔ)言模型一些新的無(wú)法解釋的能力，謹(jǐn)慎的科學(xué)家們反而低估了它們。許多人認(rèn)為，大語(yǔ)言模型不過(guò)是稍微高級(jí)點(diǎn)的馬爾科夫鏈 (Markov chains)，最多只能重復(fù)訓(xùn)練集里有限變化的內(nèi)容。然而，越來(lái)越多的證據(jù)表明，這種看法幾乎可能是大錯(cuò)特錯(cuò)的。同時(shí)，很多吃瓜群眾過(guò)分夸大了大語(yǔ)言模型的能力，認(rèn)為它們擁有現(xiàn)實(shí)中根本不存在的超自然力量。事實(shí)上，大語(yǔ)言模型最多只能在其訓(xùn)練數(shù)據(jù)所代表的空間內(nèi)進(jìn)行插值，即使如此，它們的這一能力也已經(jīng)相當(dāng)驚人。真要是今天的大語(yǔ)言模型能夠在看過(guò)的所有代碼構(gòu)成的空間內(nèi)自如插值，它們即便不能創(chuàng)造真正的新穎事物，也足以取代 99% 的程序員。但現(xiàn)實(shí)情況要并沒(méi)有這么樂(lè)觀。大語(yǔ)言模型確實(shí)可以編寫一些它之前未曾見(jiàn)過(guò)的程序，展示出將不同思想的訓(xùn)練數(shù)據(jù)融合的能力，但這種能力目前還有很大的限制，尤其是在需要細(xì)膩推理時(shí)，它們往往無(wú)法勝任。盡管如此，它們?nèi)源碇鴱娜斯ぶ悄苷Q生至今的最偉大成就，這一點(diǎn)似乎無(wú)庸置疑。

無(wú)知卻博學(xué) ? 確實(shí)，大語(yǔ)言模型大體上只能進(jìn)行初級(jí)的推理，這些推理經(jīng)常不準(zhǔn)確，甚至?xí)诫s著一些關(guān)于不存在事實(shí)的幻覺(jué)。但它們卻擁有海量的知識(shí)。在編程領(lǐng)域，以及其他有高質(zhì)量數(shù)據(jù)的領(lǐng)域，大語(yǔ)言模型就像是理解力有限卻知識(shí)淵博的人。如果要和這樣的伙伴進(jìn)行結(jié)對(duì)編程（對(duì)我來(lái)說(shuō)，結(jié)對(duì)編程本身就是個(gè)痛苦），可能會(huì)很糟糕：它們可能提出一些荒謬的想法，我們需要不斷斗爭(zhēng)才能貫徹我們自己的想法。但如果這個(gè)博學(xué)的傻瓜能夠聽(tīng)從我們的指令，回答我們提出的所有問(wèn)題，那一切都會(huì)變得不同?，F(xiàn)有的大語(yǔ)言模型雖然不能引領(lǐng)我們超越已知的路徑，但如果我們想探索一個(gè)不熟悉的領(lǐng)域，它們往往能夠幫我們從一無(wú)所知到掌握足夠的知識(shí)來(lái)獨(dú)立前行。在編程領(lǐng)域，直到二十或三十年前，這些能力可能還不太引人注目。

那時(shí)，你需要掌握幾種編程語(yǔ)言、經(jīng)典算法以及那些基本的庫(kù)。其余的則依靠你自己的智慧、專業(yè)知識(shí)和設(shè)計(jì)能力。具備這些素質(zhì)，你就能成為一名全能的專家級(jí)程序員。然而，隨著時(shí)間的推移，我們見(jiàn)證了框架、編程語(yǔ)言、各種庫(kù)的大量涌現(xiàn)。這種復(fù)雜性通常是不必要的，甚至無(wú)法自圓其說(shuō)，但事實(shí)就是如此。在這樣的情況下，一個(gè)無(wú)所不知的“白癡”成了寶貴的盟友。我來(lái)舉個(gè)例子：我對(duì)機(jī)器學(xué)習(xí)的實(shí)驗(yàn)最初是用 Keras 進(jìn)行的，持續(xù)了至少一年。后來(lái)因各種原因，我轉(zhuǎn)向了 PyTorch。我已經(jīng)了解什么是嵌入（Embedding）或殘差網(wǎng)絡(luò)（Residual Networks, ResNets），但我并不想深入研究 PyTorch 的文檔（就像我學(xué)習(xí) Keras 那樣，那時(shí) ChatGPT 還不存在）。有了大語(yǔ)言模型，用 Torch 編寫 Python 代碼變得非常容易。我只需清楚地了解我想要構(gòu)建的模型，并提出合適的問(wèn)題。

應(yīng)用案例 ? 我要討論的不是那些簡(jiǎn)單的問(wèn)題，比如“嘿，類 X 是如何執(zhí)行 Y 操作的？”如果只是這些問(wèn)題，那些對(duì)大語(yǔ)言模型保持懷疑態(tài)度的人可能就有理由了。但實(shí)際上，更復(fù)雜的模型能做的事情遠(yuǎn)遠(yuǎn)超出這些。幾年前，這些還被認(rèn)為是不可思議的魔法。我可以這樣對(duì) GPT4 下指令：看，這是我在 PyTorch 中實(shí)現(xiàn)的神經(jīng)網(wǎng)絡(luò)模型。這里是我的數(shù)據(jù)批次。我想調(diào)整這些張量的大小，以便它們能與神經(jīng)網(wǎng)絡(luò)輸入的要求相匹配，并且我希望以這種特別的方式展現(xiàn)它們。你能幫我寫出調(diào)整這些張量尺寸的代碼嗎？GPT4 幫我寫出了代碼，我接下來(lái)要做的，就是在 Python 命令行界面中測(cè)試這些張量是否真的符合我需要的大小，以及數(shù)據(jù)結(jié)構(gòu)是否正確。再舉一個(gè)例子。不久前，我需要為基于 ESP32 的設(shè)備開(kāi)發(fā)一個(gè)藍(lán)牙低能耗 (BLE) 客戶端。經(jīng)過(guò)研究后，我發(fā)現(xiàn)多平臺(tái)藍(lán)牙編程接口大都不好用。解決方法很簡(jiǎn)單，就是用 Objective C 和 macOS 的原生 API 來(lái)編寫代碼。但這樣一來(lái)，我就面臨著兩個(gè)問(wèn)題：一是學(xué)習(xí) Objective C 中復(fù)雜的 BLE API，這些 API 充滿了我認(rèn)為完全沒(méi)有必要的復(fù)雜設(shè)計(jì)（作為一個(gè)極簡(jiǎn)主義者，這些設(shè)計(jì)與我所認(rèn)為的“好設(shè)計(jì)”截然相反）；二是回憶起怎樣使用 Objective C 編程。我上次使用 Objective C 編寫程序是十年前了，很多細(xì)節(jié)，比如事件循環(huán)、內(nèi)存管理等，我都已經(jīng)記不清了。最后的結(jié)果就是這段代碼，雖然它看起來(lái)不是很美觀，但它完成了它的任務(wù)。我在極短的時(shí)間內(nèi)就編寫完成了。否則根本不可能做到這一點(diǎn)。 https://github.com/antirez/freakwan/blob/main/osx-bte-cli/SerialBTE.m 這段代碼主要是通過(guò)在 ChatGPT 上復(fù)制粘貼我想實(shí)現(xiàn)但不太確定如何著手的功能來(lái)編寫的，因此最初它們并未能正確運(yùn)行。

然后，大語(yǔ)言模型幫我指出了問(wèn)題所在并告訴我如何解決。雖然大部分代碼不是由 LLM 直接編寫的，但它確實(shí)極大地加快了編程速度。不用 ChatGPT 我也能完成這個(gè)任務(wù)嗎？答案是肯定的，但更有趣的不僅是它節(jié)省了我很多時(shí)間：事實(shí)上，如果沒(méi)有 ChatGPT，我連嘗試的勇氣都沒(méi)有，因?yàn)槟撬坪醪⒉恢档谩＿@一點(diǎn)至關(guān)重要。對(duì)于我的項(xiàng)目來(lái)說(shuō)，編寫這樣一個(gè)不重要的程序的努力與其帶來(lái)的好處的比例本來(lái)是不劃算的。此外，這個(gè)過(guò)程產(chǎn)生了一個(gè)比程序本身更有用的副作用：為了這個(gè)項(xiàng)目，我對(duì) linenoise（我用于行編輯的一個(gè)庫(kù)）進(jìn)行了改造，使其可以在多路復(fù)用環(huán)境下運(yùn)行。這是另一個(gè)例子，更多地涉及到數(shù)據(jù)解釋而非代碼編寫。我打算用一個(gè)我在網(wǎng)上發(fā)現(xiàn)的卷積神經(jīng)網(wǎng)絡(luò) (Convolutional Neural Network) 設(shè)置一個(gè) Python 腳本，但這個(gè)網(wǎng)絡(luò)缺乏詳細(xì)文檔。網(wǎng)絡(luò)的一大優(yōu)勢(shì)是它采用了 ONNX (Open Neural Network Exchange) 格式，這使我能夠輕松地識(shí)別出網(wǎng)絡(luò)的輸入和輸出以及它們對(duì)應(yīng)的名稱。我對(duì)這個(gè)卷積網(wǎng)絡(luò)了解的唯一一點(diǎn)是：它能識(shí)別圖像中的特定特征。但我不知道所需輸入圖像的格式和大小，更何況，網(wǎng)絡(luò)的輸出比我預(yù)想的要復(fù)雜得多（我原本以為它是一個(gè)二元分類器 (binary classifier)，用于判斷觀察到的圖像是否正?；虼嬖趩?wèn)題。

我原以為它只有兩個(gè)輸出，但實(shí)際上有數(shù)百個(gè)）。我首先把 ONNX 網(wǎng)絡(luò)的元數(shù)據(jù)輸出復(fù)制粘貼到 ChatGPT 中，并向助手闡述了我所知道的關(guān)于網(wǎng)絡(luò)的有限信息。ChatGPT 推測(cè)了輸入的組織方式，以及輸出可能是標(biāo)準(zhǔn)化后的框，用于指出圖像中潛在缺陷的部分，還有其他輸出表示這些缺陷的可能性。經(jīng)過(guò)幾分鐘的交流，我得到了一個(gè)能進(jìn)行網(wǎng)絡(luò)推斷的 Python 腳本，以及將起始圖像轉(zhuǎn)換為適合輸入的張量等必要代碼。讓我印象深刻的是，當(dāng) ChatGPT 觀察到測(cè)試圖像上的原始輸出值（基本上是邏輯單元 (logits)）時(shí)，它終于“理解”了網(wǎng)絡(luò)的運(yùn)作方式：一系列浮點(diǎn)數(shù)為識(shí)別輸出的確切細(xì)節(jié)和標(biāo)準(zhǔn)化提供了上下文，比如框是否居中或指定了左上角等細(xì)節(jié)。

一次性程序 ? 我曾經(jīng)遇到過(guò)很多類似的情況，就像我之前敘述的那樣。但記錄這些并沒(méi)有太大意義，因?yàn)檫@些情況重復(fù)的故事基本相同。我的問(wèn)題是，我需要迅速了解一些事情，特別是在大語(yǔ)言模型給出的回答可能是無(wú)稽之談時(shí)，我得能夠驗(yàn)證這些信息的真實(shí)性。在這種情況下，我會(huì)利用大語(yǔ)言模型加快我的知識(shí)獲取速度。但在其他情況下，我會(huì)讓大語(yǔ)言模型完全編寫代碼。舉個(gè)例子，當(dāng)我需要編寫一個(gè)基本可以隨時(shí)丟棄的程序時(shí)。比如這個(gè)： 簡(jiǎn)單語(yǔ)言模型示例程序 我需要可視化一個(gè)小型神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)過(guò)程中的損失曲線（loss curve）。

我向 GPT4 展示了 PyTorch 程序在學(xué)習(xí)過(guò)程中生成的 CSV 文件格式，然后我提出了一個(gè)需求：如果我在命令行中指定了多個(gè) CSV 文件，我不想再看到同一實(shí)驗(yàn)的訓(xùn)練和驗(yàn)證損失曲線，而是想比較不同實(shí)驗(yàn)的驗(yàn)證損失曲線。上面就是 GPT4 生成的結(jié)果，總共用了三十秒。類似地，我需要一個(gè)程序來(lái)讀取 AirBnB 的 CSV 報(bào)告，并按月份和年份對(duì)我的公寓進(jìn)行分組。接著，它會(huì)考慮清潔成本和每次預(yù)訂的夜晚數(shù)量，統(tǒng)計(jì)不同月份的平均租金價(jià)格。這個(gè)程序?qū)ξ曳浅Ｓ杏?，但編寫它又極其無(wú)聊，因?yàn)檫^(guò)程中沒(méi)有什么新穎之處。因此，我把 CSV 文件的一部分復(fù)制粘貼到 GPT4 上，告訴大語(yǔ)言模型我要解決的問(wèn)題。程序第一次嘗試就運(yùn)行成功了，下面是完整的展示。

import pandas as pd
pd.set_option('display.max_rows', None)
df = pd.read_csv('listings.csv')
reservations = df[df['Type'] == 'Reservation']
reservations['Start Date'] = pd.to_datetime(reservations['Start Date'])
reservations['Year'] = reservations['Start Date'].dt.year
reservations['Month'] = reservations['Start Date'].dt.month
reservations['Nightly Rate'] = (reservations['Amount'] - reservations['Cleaning Fee']) / reservations['Nights']
all_listings = reservations['Listing'].unique()
all_years = reservations['Year'].unique()
all_months = range(1, 13)
index = pd.MultiIndex.from_product([all_listings, all_years, all_months], names=['Listing', 'Year', 'Month'])
all_data = pd.DataFrame(index=index).reset_index()
merged_data = pd.merge(all_data, reservations, on=['Listing', 'Year', 'Month'], how='left')
average_nightly_rates = merged_data.groupby(['Listing', 'Year', 'Month'])['Nightly Rate'].mean().fillna(0)

要準(zhǔn)確地理解如何對(duì)這些原本分散和無(wú)序的數(shù)據(jù)進(jìn)行分組，需要一些簡(jiǎn)單的邏輯推理。這不是大語(yǔ)言模型僅憑重復(fù)它所見(jiàn)過(guò)的語(yǔ)言模式就能簡(jiǎn)單解決的問(wèn)題。雖然 GPT4 在訓(xùn)練中肯定觀察到了類似的程序，但幾乎可以肯定它沒(méi)有看到一個(gè)程序需要以我所要求的方式，在具有特定格式的 CSV 文件中對(duì)數(shù)據(jù)進(jìn)行分組。這證明了（至少在我看來(lái)），大語(yǔ)言模型能夠在其訓(xùn)練集中不同程序所勾勒的范圍內(nèi)進(jìn)行一定程度的創(chuàng)新和推理。在我個(gè)人看來(lái)，編寫這類程序可能是對(duì)時(shí)間的不明智使用。一個(gè)大語(yǔ)言模型能替我完成這項(xiàng)工作，顯著提升了我編程的效率。這意味著，我能將精力集中在真正重要的事務(wù)上。

當(dāng)事情不按計(jì)劃進(jìn)行：系統(tǒng)編程的挑戰(zhàn) ? 在大語(yǔ)言模型和編程領(lǐng)域，我取得了一定的成功。但是，當(dāng)我使用 C 語(yǔ)言編寫程序時(shí)，我通常只把 LLM 作為一種更便捷的文檔工具。作為一名系統(tǒng)編程專家，我發(fā)現(xiàn)只有在 LLM 能進(jìn)行復(fù)雜的推理分析時(shí)，它們才對(duì)我有實(shí)際用處。而在這方面，LLM 經(jīng)常無(wú)法滿足期望。讓我們看一個(gè)實(shí)驗(yàn)例子：試著概述一個(gè)高效、小型但完整的 C 語(yǔ)言實(shí)現(xiàn)的布隆過(guò)濾器（Bloom Filter）的要求，重點(diǎn)在于哈希（hashing）功能的關(guān)鍵要素。然后用優(yōu)質(zhì)的 C 語(yǔ)言編寫它。另外，考慮到你的例子應(yīng)該可以存儲(chǔ) 100,000 個(gè)元素，并且誤報(bào)概率不超過(guò) 5%。添加的元素是以空字符結(jié)尾的字符串。以下是輸出結(jié)果：

#include 
#include 
#include 
#include 


#define N 100000  // Number of elements
#define P 0.05    // False positive probability
#define M (int)(-(N * log(P)) / (log(2) * log(2)))  // Size of bit array
#define K (int)(M / N * log(2))  // Number of hash functions


unsigned char bitArray[M / 8 + 1];


void setBit(int n) {
    bitArray[n / 8] |= 1 << (n % 8);
}


int getBit(int n) {
    return bitArray[n / 8] & (1 << (n % 8));
}


// Basic hash functions (for demonstration purposes)
int hash1(char *str) {
    int hash = 5381;
    int c;
    while ((c = *str++))
        hash = ((hash << 5) + hash) + c;
    return abs(hash % M);
}


int hash2(char *str) {
    unsigned long hash = 0;
    int c;
    while ((c = *str++))
        hash = c + (hash << 6) + (hash << 16) - hash;
    return abs(hash % M);
}


void add(char *str) {
    setBit(hash1(str));
    setBit(hash2(str));
    // Add more hash functions if needed
}


int is_in(char *str) {
    return getBit(hash1(str)) && getBit(hash2(str));
    // Check more hash functions if used
}


int main() {
    char *testStr = "testString";
    add(testStr);


    if (is_in(testStr)) {
        printf("%s is probably in the set.
", testStr);
    } else {
        printf("%s is definitely not in the set.
", testStr);
    }


    return 0;
}

GPT4 所生成的布隆過(guò)濾器實(shí)現(xiàn)上并不算很出色。布隆過(guò)濾器應(yīng)用廣泛，并不是什么稀奇古怪的數(shù)據(jù)結(jié)構(gòu)。然而，要編寫一個(gè)合格的布隆過(guò)濾器，需要更高層次的抽象思維。比如，需要找到一種有效的方法，對(duì)同一個(gè)字符串進(jìn)行多次哈希處理，同時(shí)確保這些哈希值相互之間的獨(dú)立性。但是，如果你明確指示 GPT4 改進(jìn)哈希函數(shù)，使之能產(chǎn)生多個(gè)互不相關(guān)的輸出，它提出的方案就顯得更加合理： ?

unsigned int hash(const char* str, unsigned int hash_id) {
 unsigned int hash = 5381;
 int c;
 while ((c = *str++)) {
 hash = ((hash << 5) + hash) + c + hash_id;
 }
 return hash % BF_SIZE;
}

? 如果 GPT4 能夠自行提出這種方案，它編寫的布隆過(guò)濾器將會(huì)有所不同，可能會(huì)使用單一的哈希函數(shù)一次性設(shè)置多個(gè)位。 GPT4 能夠獨(dú)立完成編寫合適且更通用哈希函數(shù)的任務(wù)。但在整個(gè)布隆過(guò)濾器的編寫過(guò)程中，它未能表現(xiàn)出足夠的推理能力。相反，它只是提供了兩種不同但相似的哈希函數(shù)，這種結(jié)果更像是從一篇關(guān)于布隆過(guò)濾器的低質(zhì)量文章中看到的。大語(yǔ)言模型在推理能力上的不足，加上可能缺乏高質(zhì)量的相關(guān)資料，甚至還可能存在大量低質(zhì)量的資料，共同造成了這種不盡人意的結(jié)果。

事實(shí)上，這并非個(gè)例。在算法或系統(tǒng)編程領(lǐng)域，我嘗試使用 LLM 的體驗(yàn)通常都很差勁，哪怕在類似 Python 編程這樣的領(lǐng)域，LLM 表現(xiàn)出來(lái)的推理能力并不算高。與此同時(shí)，GPT-4 不僅能反編譯它生成的函數(shù)（在另一個(gè)獨(dú)立會(huì)話中），還能精準(zhǔn)地理解該函數(shù)的用途： https://chat.openai.com/share/f54b64d7-d19a-4be4-8f10-08553aa812f1 因此，認(rèn)為 GPT-4 在系統(tǒng)編程領(lǐng)域無(wú)用的說(shuō)法顯然是不恰當(dāng)?shù)摹?有趣的是，這些情況下，小型與大型模型之間的差異顯著。來(lái)看看兩個(gè)本地模型的對(duì)比表現(xiàn)。例如，Mistral 的專家模型 (MoE) Mixtral，對(duì)同樣的問(wèn)題給出了以下回應(yīng)： ?

unsigned int hash(const char* str, unsigned int hash_id) {
 unsigned int hash = 5381;
 int c;
 while ((c = *str++)) {
 hash = ((hash << 5) + hash) + c;
 }
 return hash + hash_id;
}

? 顯然，僅在最后加入 hash_id 是一個(gè)非常不佳的解決方案。Mixtral 對(duì)許多應(yīng)用而言是一個(gè)優(yōu)秀的模型，但對(duì)于大語(yǔ)言模型本就有限的推理能力來(lái)說(shuō)，目前的規(guī)則顯然是：越大越好。這是我與本地大型語(yǔ)言模型 deepseek-coder 的對(duì)話記錄。由于 RAM 有限，我只能將模型量化到 4 位來(lái)使用。盡管如此，作為一個(gè)擁有 340 億參數(shù)的龐大模型，它在這個(gè)問(wèn)題上的推理能力似乎相當(dāng)出色。以下是我用 llama.cpp 進(jìn)行的聊天記錄：

我有一個(gè)哈希函數(shù)，它應(yīng)該為相同的數(shù)據(jù)輸出 N 個(gè)不同的哈希。但是，我發(fā)現(xiàn)當(dāng)我改變 hash_id 的值時(shí)，生成的哈希分布非常差：

unsigned int hash(const char* str, unsigned int hash_id) {
 unsigned int hash = 5381;
 int c;
 while ((c = *str++)) {
 hash = ((hash << 5) + hash) + c;
 }
 return hash + hash_id;
}

? 可能是我使用的加鹽策略不夠好？我該如何改進(jìn)呢？ [Deep-seek coder 的回復(fù)] 你的實(shí)現(xiàn)中可能存在的一個(gè)問(wèn)題是，你只是簡(jiǎn)單地在哈希的末尾添加了 hash_id。這可能會(huì)導(dǎo)致分布不均，尤其是當(dāng) hash_id 過(guò)大或分布不均時(shí)更為明顯。考慮使用位運(yùn)算來(lái)混合 hash_id。這里有一個(gè)使用異或 (XOR) 運(yùn)算的例子： ?

unsigned int hash(const char* str, unsigned int hash_id) {
 unsigned int hash = 5381;
 int c;
 while ((c = *str++)) {
 hash = ((hash << 5) + hash) ^ c + hash_id; // Using XOR to mix in the hash_id
 }
 return (hash ^ hash_id); // Mixing the hash_id one more time at the end
}

這樣做可以比簡(jiǎn)單添加更有效地分布 hash_id，從而使哈希分布更均勻。[省略……實(shí)際回復(fù)更詳盡] 在我的 MacBook M1 Max 上運(yùn)行的這個(gè)模型表現(xiàn)得相當(dāng)不錯(cuò)。它成功地將求和和異或操作混合使用了。在這個(gè)案例中，模型得到了我提供的關(guān)于問(wèn)題的線索的幫助，但最終是模型自己識(shí)別出了問(wèn)題的真正所在，并提出了一個(gè)有效的解決方案。這樣的成就是任何書籍、文檔或 Google 搜索都無(wú)法達(dá)到的。不管你如何看待這個(gè)模型——無(wú)論是作為一個(gè)初級(jí)的、基于插值的結(jié)果，還是以其他方式——它確實(shí)展現(xiàn)了某種形式的推理能力。

在這個(gè)特定案例中，如果我們認(rèn)為識(shí)別問(wèn)題的根源和找到可能的解決方案是一種推理，那么它確實(shí)做到了這一點(diǎn)。但無(wú)論我們?nèi)绾慰创笳Z(yǔ)言模型，斷言它們對(duì)程序員無(wú)用是非常草率的。然而，根據(jù)我過(guò)去幾個(gè)月的經(jīng)驗(yàn)，對(duì)于系統(tǒng)編程來(lái)說(shuō)，如果你已是資深程序員，大語(yǔ)言模型往往無(wú)法提供令人滿意的解決方案。我來(lái)舉一個(gè)真實(shí)世界中的例子。我的最新項(xiàng)目，ggufflib，涉及到開(kāi)發(fā)一個(gè)讀寫 GGUF 格式文件的庫(kù)，而這正是 llama.cpp 用來(lái)加載量化模型的格式。起初，為了弄懂量化編碼的工作原理（因?yàn)樗俣仍?，每個(gè)量化比特都以特殊方式存儲(chǔ)），我試過(guò)使用 ChatGPT，但最后我選擇了對(duì) llama.cpp 代碼進(jìn)行逆向工程，這樣更加迅速。一個(gè)能夠有效協(xié)助系統(tǒng)程序員的大語(yǔ)言模型，在看到數(shù)據(jù)編碼的結(jié)構(gòu)聲明和解碼函數(shù)后，應(yīng)該能夠重建數(shù)據(jù)格式的文檔。雖然 llama.cpp 的功能足夠簡(jiǎn)短，可以完全放入 GPT4 的上下文中，但它的輸出卻毫無(wú)用處。在這些情況下，我們還是得回歸傳統(tǒng)方式：紙筆在手，細(xì)讀代碼，尋找解碼器提取的比特在哪里注冊(cè)。為了讓你更好地理解上述案例，如果你感興趣，可以嘗試一下。這里有一個(gè)來(lái)自 llama.cpp 實(shí)現(xiàn)的結(jié)構(gòu)。 ?

// 6-bit quantization
// weight is represented as x = a * q
// 16 blocks of 16 elements each
// Effectively 6.5625 bits per weight
typedef struct {
 uint8_t ql[QK_K/2]; // quants, lower 4 bits
 uint8_t qh[QK_K/4]; // quants, upper 2 bits
 int8_t scales[QK_K/16]; // scales, quantized with 8 bits
 ggml_fp16_t d; // super-block scale
} block_q6_K;

? 然后是用于執(zhí)行去量化的函數(shù)： ?

void dequantize_row_q6_K(const block_q6_K * restrict x, float * restrict y, int k) {
 assert(k % QK_K == 0);
 const int nb = k / QK_K;
 for (int i = 0; i < nb; i++) {
 const float d = GGML_FP16_TO_FP32(x[i].d);
 const uint8_t * restrict ql = x[i].ql;
 const uint8_t * restrict qh = x[i].qh;
 const int8_t * restrict sc = x[i].scales;
 for (int n = 0; n < QK_K; n += 128) {
 for (int l = 0; l < 32; ++l) {
 int is = l/16;
 const int8_t q1 = (int8_t)((ql[l + 0] & 0xF) | (((qh[l] >> 0) & 3) << 4)) - 32;
 const int8_t q2 = (int8_t)((ql[l + 32] & 0xF) | (((qh[l] >> 2) & 3) << 4)) - 32;
 const int8_t q3 = (int8_t)((ql[l + 0] >> 4) | (((qh[l] >> 4) & 3) << 4)) - 32;
 const int8_t q4 = (int8_t)((ql[l + 32] >> 4) | (((qh[l] >> 6) & 3) << 4)) - 32;
 y[l + 0] = d * sc[is + 0] * q1;
 y[l + 32] = d * sc[is + 2] * q2;
 y[l + 64] = d * sc[is + 4] * q3;
 y[l + 96] = d * sc[is + 6] * q4;
 }
 y += 128;
 ql += 64;
 qh += 32;
 sc += 8;
 }
 }
}

? 當(dāng)我請(qǐng)求 GPT4 編寫關(guān)于使用格式的概述時(shí)，它難以清晰地說(shuō)明“ql”中上下四位的數(shù)據(jù)塊是如何存儲(chǔ)的，這與權(quán)重位置有關(guān)。在撰寫這篇博客時(shí)，我還嘗試讓它編寫一個(gè)簡(jiǎn)化版本的函數(shù)來(lái)展示數(shù)據(jù)的存儲(chǔ)方式（可能它難以用文字解釋，但可以通過(guò)代碼來(lái)表達(dá)）。然而，它生成的函數(shù)存在諸多問(wèn)題，比如索引不正確，從 6 位到 8 位的符號(hào)擴(kuò)展處理錯(cuò)誤（僅僅是將其轉(zhuǎn)換為 uint8_t 類型），等等。對(duì)了，這是我最終自己編寫的代碼： ?

} else if (tensor->type == GGUF_TYPE_Q6_K) {
 uint8_t *block = (uint8_t*)tensor->weights_data;
 uint64_t i = 0; // i-th weight to dequantize.
 while(i < tensor->num_weights) {
 float super_scale = from_half(*((uint16_t*)(block+128+64+16)));
 uint8_t *L = block;
 uint8_t *H = block+128;
 int8_t *scales = (int8_t*)block+128+64;
 for (int cluster = 0; cluster < 2; cluster++) {
 for (uint64_t j = 0; j < 128; j++) {
 f[i] = (super_scale * scales[j/16]) *
 ((int8_t)
 ((((L[j%64] >> (j/64*4)) & 0xF) |
 (((H[j%32] >> (j/32*2)) & 3) << 4)))-32);
 i++;
 if (i == tensor->num_weights) return f;
 }
 L += 64;
 H += 32;
 scales += 8;
 }
 block += 128+64+16+2; // Go to the next block.
 }
}

? 從上述函數(shù)中，我移除了這段代碼的核心貢獻(xiàn)：即長(zhǎng)篇注釋，詳細(xì)記錄了 llama.cpp 中 Q6_K 編碼使用的確切格式?，F(xiàn)在，如果 GPT 能夠幫我完成這一工作，那將非常有幫助。我相信這只是時(shí)間問(wèn)題，因?yàn)檫@類任務(wù)在沒(méi)有技術(shù)突破的情況下也是可行的，只需適當(dāng)?shù)臄U(kuò)展即可。

重新審視編程工作 ? 不得不說(shuō)，這是一個(gè)事實(shí)：現(xiàn)今的編程大多是在微調(diào)同樣的內(nèi)容，只是形式略有變化。這種工作并不需要太高的推理能力。大語(yǔ)言模型在這方面表現(xiàn)出色，盡管它們的能力仍然受限于上下文長(zhǎng)度。這個(gè)現(xiàn)象應(yīng)該引起程序員的深思：真的值得去編寫這類程序嗎？雖然可以賺到不錯(cuò)的收入，但如果大語(yǔ)言模型也能完成其中一部分工作，那么在未來(lái)五到十年，這可能并非最佳的職業(yè)發(fā)展方向。再來(lái)看，大語(yǔ)言模型真的具備一定的推理能力，還是只是表面上的假象？有時(shí)候，它們似乎在進(jìn)行推理，但這可能只是因?yàn)?，像符?hào)學(xué)家所說(shuō)，使用的“符號(hào)”造成了一種實(shí)際上并不存在的意義錯(cuò)覺(jué)。

足夠了解大語(yǔ)言模型的人會(huì)明白，事實(shí)并非如此：這些模型整合既有信息的能力，遠(yuǎn)非簡(jiǎn)單的詞匯重復(fù)。它們?cè)陬A(yù)訓(xùn)練期間的訓(xùn)練主要是預(yù)測(cè)下一個(gè) Token，這個(gè)過(guò)程迫使模型構(gòu)建了一種抽象的模型。雖然這個(gè)模型可能脆弱、零散且不完美，但從我們觀察到的現(xiàn)象來(lái)看，它確實(shí)存在。在數(shù)學(xué)確定性存在疑問(wèn)，且領(lǐng)域內(nèi)頂尖專家意見(jiàn)分歧的情況下，相信自己的直覺(jué)似乎是明智之舉。

最后，今天還有什么理由不去使用大語(yǔ)言模型輔助編程呢？ 正確地向大語(yǔ)言模型提問(wèn)是一項(xiàng)關(guān)鍵技能。這項(xiàng)技能練習(xí)得越少，利用 AI 改善工作的能力就越弱。而且，無(wú)論是與大語(yǔ)言模型還是與人類交流，清晰描述問(wèn)題同樣重要。溝通不暢是一個(gè)嚴(yán)重的障礙，很多程序員盡管在自己的專業(yè)領(lǐng)域很有能力，但在溝通上卻做得很糟糕?，F(xiàn)在，連 Google 都變得不那么好用了，所以即便是將大語(yǔ)言模型作為一種壓縮文檔的方式來(lái)使用，也是個(gè)不錯(cuò)的主意。至于我，我將繼續(xù)大量使用它們。我從來(lái)不喜歡去深究某個(gè)晦澀的通訊協(xié)議的細(xì)節(jié)，或者去理解由某些想要炫耀自己技術(shù)的人編寫的復(fù)雜庫(kù)方法。這些對(duì)我來(lái)說(shuō)就像是"無(wú)用知識(shí)"。有了大語(yǔ)言模型，我就能免于這些困擾，每天都能感覺(jué)到它帶來(lái)的幫助。

審核編輯：黃飛

閱讀全文

神經(jīng)網(wǎng)絡(luò)(98386) 神經(jīng)網(wǎng)絡(luò)(98386)
機(jī)器學(xué)習(xí)(130423) 機(jī)器學(xué)習(xí)(130423)
Redis(10465) Redis(10465)
大模型(810) 大模型(810)

評(píng)論

相關(guān)推薦

C語(yǔ)言-文件編程

這篇文章介紹C語(yǔ)言的文件編程函數(shù)，案例代碼是在Linux環(huán)境下運(yùn)行測(cè)試的分別介紹了C語(yǔ)言標(biāo)準(zhǔn)庫(kù)的文件編程接口和Linux下的文件編程函數(shù)。

2022-09-09 11:33:30

1630

如何利用Transformers了解視覺(jué)語(yǔ)言模型

將模型稱為 “視覺(jué)語(yǔ)言” 模型是什么意思？一個(gè)結(jié)合了視覺(jué)和語(yǔ)言模態(tài)的模型？但這到底是什么意思呢？

2023-03-03 09:49:37

665

如何使用Rust連接Redis

Redis是一款快速、開(kāi)源、鍵值存儲(chǔ)數(shù)據(jù)庫(kù)，被廣泛應(yīng)用于緩存、發(fā)布/訂閱系統(tǒng)、定時(shí)任務(wù)等場(chǎng)景中。Rust提供了很多Redis的客戶端庫(kù)，本教程將會(huì)介紹如何使用Rust連接Redis，以及如何通過(guò)

2023-09-19 16:22:28

1237

Redis Stream應(yīng)用案例

今天介紹的主角——Redis Stream，本身就是起源于IRC中一個(gè)用戶的idea。IRC的模型如下，在某個(gè)IRC頻道中的用戶，既可以向所有的其他用戶自由的發(fā)送消息，也可以接收其他所有用戶發(fā)送

2018-06-26 17:15:29

Redis主從復(fù)制的作用和步驟

Redis青銅修煉手冊(cè)（五） --- Redis的主從復(fù)制

2019-06-27 07:20:46

Redis使用總結(jié)

Spring+SpringMVC+MyBatis+easyUI整合進(jìn)階篇（十四）Redis緩存正確的使用姿勢(shì)

2019-09-05 08:31:57

Redis基礎(chǔ)知識(shí)概述

Redis——基礎(chǔ)知識(shí)

2020-04-21 07:42:22

redis安裝與使用流程概述

Go語(yǔ)言第6天 - redis安裝與使用

2019-07-29 09:50:12

redis概述

REmote DIctionary Server（Redis）是一個(gè)基于key-value鍵值對(duì)的持久化數(shù)據(jù)庫(kù)存儲(chǔ)系統(tǒng)。redis和大名鼎鼎的Memcached緩存服務(wù)軟件很像，但是redis支持

2019-07-17 07:38:30

redis緩存注解怎么使用

spring boot —— redis 緩存注解使用教程

2019-09-11 14:43:48

C編程最佳實(shí)踐.doc

C編程最佳實(shí)踐.doc

2012-08-17 14:37:18

C語(yǔ)言編程資料

VC.深入詳解.孫鑫(完整版)https://xbp.pub/i/GI33819c77BRT 龔建偉_Visual C++_Turbo C串口通信編程實(shí)踐.pdf...https://xbp.pub

2021-05-20 13:53:11

GPU編程的平臺(tái)模型、執(zhí)行模型、內(nèi)存模型及編程模型

GPU編程--OpenCL四大模型

2019-04-29 07:40:44

Python 之父退出Python 核心決策層，而轉(zhuǎn)居幕后

Python 會(huì)迎來(lái)更好的未來(lái)也不一定！......Python 之父如同大多數(shù)的編程語(yǔ)言之父一般，Guido van Rossum 也有著輝煌的履歷。1982 年，Guido van Rossum

2018-07-14 17:45:18

centos7 redis的安裝

centos7 redis 使用,查看Redis工具（安裝、添加權(quán)限驗(yàn)證、添加開(kāi)機(jī)自啟）

2019-05-14 17:13:40

labview讀寫操作REDIS

本帖最后由 SevenLi8408 于 2022-9-15 08:07 編輯分享一個(gè)好用的非關(guān)系型緩存數(shù)據(jù)庫(kù)的使用方法。REDIS桌面管理軟件https://github.com

2022-08-15 10:32:21

laravel使用redis

laravel操作redis筆記！

2019-09-24 09:40:58

linux的redis啟動(dòng)方式

tar zxvf redis-2.8.9.tar.gzcd redis-2.8.9#直接make 編譯make#可使用root用戶執(zhí)行`make install`，將可執(zhí)行文件拷貝到/usr/local/bin目錄下。這樣就可以直接敲名字運(yùn)行程序了。make install啟動(dòng)

2019-07-17 08:03:13

linux的redis安裝啟動(dòng)

1.將下載好的壓縮包放到/usr/local目錄下# tar x*** redis-3.0.2.tar.gz# cd redis-3.0.2# make提示錯(cuò)誤 make: cc: Command not found make: *** [adlist.o] Error 127沒(méi)有安裝gcc環(huán)境，需要安裝gcc

2019-07-18 08:05:14

linux網(wǎng)絡(luò)編程實(shí)踐

linux網(wǎng)絡(luò)編程實(shí)踐-linux應(yīng)用編程和網(wǎng)絡(luò)編程第9部分互聯(lián)網(wǎng)課程品牌...

2021-12-23 06:38:29

《C++程序設(shè)計(jì)原理與實(shí)踐》(C++之父最新力作)

`《C++程序設(shè)計(jì)原理與實(shí)踐》(C++之父最新力作)`

2012-08-19 16:30:29

《RISC-V體系結(jié)構(gòu)編程與實(shí)踐》試讀

本書詳細(xì)地介紹了RISC-V的基本原理、指令集、編程工具和環(huán)境、體系結(jié)構(gòu)和擴(kuò)展以及應(yīng)用案例和實(shí)踐等方面的內(nèi)容，覆蓋了RISC-V體系結(jié)構(gòu)的各個(gè)方面，使讀者能夠全面深入地了解RISC-V的體系結(jié)構(gòu)

2023-04-03 15:15:20

【書籍評(píng)測(cè)活動(dòng)NO.30】大規(guī)模語(yǔ)言模型：從理論到實(shí)踐

更多的自然語(yǔ)言處理研究人員和對(duì)大語(yǔ)言模型感興趣的讀者能夠快速了解大模型的理論基礎(chǔ)，并開(kāi)展大模型實(shí)踐，復(fù)旦大學(xué)張奇教授團(tuán)隊(duì)結(jié)合他們?cè)谧匀?b class="flag-6" style="color: red">語(yǔ)言處理領(lǐng)域的研究經(jīng)驗(yàn)，以及分布式系統(tǒng)和并行計(jì)算的教學(xué)經(jīng)驗(yàn)，在

2024-03-11 15:16:39

【書籍評(píng)測(cè)活動(dòng)NO.31】大語(yǔ)言模型：原理與工程實(shí)踐

深遠(yuǎn)影響，尤其在優(yōu)化業(yè)務(wù)流程和重塑組織結(jié)構(gòu)方面。然而，在研究和實(shí)踐過(guò)程中，我們遇到了一個(gè)主要挑戰(zhàn)：市場(chǎng)上缺乏大語(yǔ)言模型在實(shí)際應(yīng)用方面的資料?，F(xiàn)有的資料多聚焦于理論研究，而具體的實(shí)踐方法多被保密，難以獲得

2024-03-18 15:49:46

使用Redis緩存model層

〈譯〉使用REDIS處理RAILS MODEL緩存

2019-04-18 17:07:18

單片機(jī)C語(yǔ)言編程基礎(chǔ)與實(shí)踐

單片機(jī)C語(yǔ)言編程基礎(chǔ)與實(shí)踐

2012-08-20 23:18:29

啟動(dòng)Redis的三種方法

Redis筆記（1）——安裝、卸載、三種方法啟動(dòng)Redis，Redis命令使用（干貨十足），Redis兩種方法設(shè)置密碼，時(shí)間復(fù)雜度（更完善哦~）

2020-06-08 16:09:26

如何使得redis中的數(shù)據(jù)不再有

嵌入式Linux系統(tǒng)重啟后如何使得redis中的數(shù)據(jù)不再有今天在工作中遇到一個(gè)問(wèn)題：網(wǎng)頁(yè)展示redis中的數(shù)據(jù)，然而再Linux系統(tǒng)重啟后網(wǎng)頁(yè)還能展示redis中的數(shù)據(jù)，感覺(jué)很奇怪，到網(wǎng)上搜了下

2021-11-05 08:50:53

并行編程模型有什么優(yōu)勢(shì)

并行編程模型是并行計(jì)算，尤其是并行軟件的基礎(chǔ)，也是并行硬件系統(tǒng)的導(dǎo)向，在面臨多核新挑戰(zhàn)的情況下，什么樣的并行編程模型在未來(lái)能成為主流，還很難說(shuō)。至少到目前，還處于百家爭(zhēng)鳴的時(shí)代，很多模型提出，很多在應(yīng)用，下面我們簡(jiǎn)單介紹一下當(dāng)前的并行編程模型現(xiàn)狀。

2019-07-11 08:03:33

求單片機(jī)C語(yǔ)言編程圖書

誰(shuí)推薦一下比較好的單片機(jī)C語(yǔ)言編程圖書對(duì)C語(yǔ)言在單片機(jī)編程介紹比較全面的實(shí)踐性比較強(qiáng)的告訴我書名和作者就好謝謝

2011-10-06 10:28:29

自然語(yǔ)言處理的語(yǔ)言模型

自然語(yǔ)言處理——53 語(yǔ)言模型（數(shù)據(jù)平滑）

2020-04-16 11:11:25

請(qǐng)問(wèn)如何分析、排查、解決Redis變慢問(wèn)題

如何分析、排查、解決Redis變慢問(wèn)題

2020-11-09 08:03:41

C語(yǔ)言編程寶典之一

2006-04-08 01:59:31

高職高專《Java 語(yǔ)言程序設(shè)計(jì)》教學(xué)與實(shí)踐

高職高?！禞ava 語(yǔ)言程序設(shè)計(jì)》教學(xué)與實(shí)踐 摘要:《java 語(yǔ)言程序設(shè)計(jì)》是高職高專院校計(jì)算機(jī)專業(yè)的一門重要專業(yè)基礎(chǔ)課, 面向?qū)ο?b class="flag-6" style="color: red">編程是目前流行的一種編程

2010-04-23 10:57:53

C語(yǔ)言編程技巧

電子發(fā)燒友為您提供了 C語(yǔ)言編程技巧，幫助您解決編程的困擾。

2011-06-23 14:53:00

601

Redis原理篇-23.Redis網(wǎng)絡(luò)模型-epoll的ET

Redis

電子學(xué)習(xí)發(fā)布于 2023-01-06 21:23:52

Redis原理篇-26.Redis網(wǎng)絡(luò)模型-Redis是單線

Redis

電子學(xué)習(xí)發(fā)布于 2023-01-06 21:53:51

Redis原理篇-17.Redis網(wǎng)絡(luò)模型-阻塞IO

Redis

電子學(xué)習(xí)發(fā)布于 2023-01-06 21:59:57

Redis高級(jí)篇-01.Redis最佳實(shí)踐課程介紹

Redis

電子學(xué)習(xí)發(fā)布于 2023-01-06 22:10:14

javascript語(yǔ)言精髓與編程實(shí)踐(第二章)介紹

javascript語(yǔ)言精髓與編程實(shí)踐(第二章)

2015-10-30 10:07:22

javascript語(yǔ)言精髓與編程實(shí)踐(第一章)介紹

javascript語(yǔ)言精髓與編程實(shí)踐(第一章)

2015-10-30 10:07:43

STM8的C語(yǔ)言編程說(shuō)明

STM8的C語(yǔ)言編程說(shuō)明STM8的C語(yǔ)言編程說(shuō)明STM8的C語(yǔ)言編程說(shuō)明STM8的C語(yǔ)言編程說(shuō)明

2015-12-10 16:19:59

單片機(jī)高級(jí)語(yǔ)言編程與_uVision2應(yīng)用實(shí)踐

Keil Cx51 V7_0單片機(jī)高級(jí)語(yǔ)言編程與_uVision2應(yīng)用實(shí)踐

2016-01-12 15:53:59

C語(yǔ)言入門經(jīng)典-C語(yǔ)言編程

C語(yǔ)言入門經(jīng)典-C語(yǔ)言編程，感興趣的可以看看哦。

2016-08-16 18:54:45

111

php session使用redis如何設(shè)置密碼

Redis是一個(gè)開(kāi)源的使用ANSI C語(yǔ)言編寫、支持網(wǎng)絡(luò)、可基于內(nèi)存亦可持久化的日志型、Key-Value數(shù)據(jù)庫(kù)，并提供多種語(yǔ)言的API。redis是一個(gè)key-value存儲(chǔ)系統(tǒng)。和Memcached類似，它支持存儲(chǔ)的value類型相對(duì)更多。

2017-11-16 15:38:40

2184

redis應(yīng)用場(chǎng)景及實(shí)例

本文主要闡述了redis應(yīng)用場(chǎng)景及實(shí)例。Redis是一個(gè)開(kāi)源的使用ANSI C語(yǔ)言編寫、支持網(wǎng)絡(luò)、可基于內(nèi)存亦可持久化的日志型、Key-Value數(shù)據(jù)庫(kù)，并提供多種語(yǔ)言的API。在這篇文章中，我們將闡述 Redis 最常用的使用場(chǎng)景，以及那些影響我們選擇的不同特性。

2018-02-09 15:01:13

6772

vb語(yǔ)言編程學(xué)習(xí)怎么入門

要想成為一名優(yōu)秀的程序員，最重要的是掌握編程思想、找到編程感覺(jué)，而不是死記硬背語(yǔ)言本身。所以，從某種角度上講，很多語(yǔ)言是一致的。學(xué)會(huì)了C++，JAVA也能夠很快上手。我們面對(duì)新的編程語(yǔ)言時(shí)，只需簡(jiǎn)單

2018-03-12 16:35:40

70120

函數(shù)式編程語(yǔ)言、編程和程序驗(yàn)證

是1930年代在調(diào)查函數(shù)定義、函數(shù)應(yīng)用和遞歸時(shí)研發(fā)的一個(gè)形式系統(tǒng)，是等價(jià)于圖靈機(jī)的一種抽象的計(jì)算模型，許多函數(shù)式編程語(yǔ)言都可看成是在?演算基礎(chǔ)上精心制作出的結(jié)果

2018-04-03 11:01:40

關(guān)于Redis的相關(guān)問(wèn)題與Memcached的對(duì)比

庫(kù)，也沒(méi)有編譯參數(shù)必需添加。redis的安裝出奇的簡(jiǎn)單，這可能也是他風(fēng)靡的一個(gè)原因，讓人很容易上手.Redis 是一個(gè)使用 C 語(yǔ)言寫成的，開(kāi)源的 key-value 數(shù)據(jù)庫(kù)。。

2018-04-23 16:19:00

1669

Redis為什么這么快！深入了解Redis的內(nèi)存模型！

Redis是目前最火爆的內(nèi)存數(shù)據(jù)庫(kù)之一，通過(guò)在內(nèi)存中讀寫數(shù)據(jù)，大大提高了讀寫速度，可以說(shuō)Redis是實(shí)現(xiàn)網(wǎng)站高并發(fā)不可或缺的一部分。

2018-05-02 16:57:54

4215

LabVIEW之父歷史回顧編程理念，這將對(duì)未來(lái)造成怎樣的影響

LabVIEW之父Jeff Kodosky回顧了他如何創(chuàng)造圖形化編程，并且分享了基本的編程理念。這些理念可以應(yīng)對(duì)高要求應(yīng)用的挑戰(zhàn)，對(duì)未來(lái)25年圖形化系統(tǒng)設(shè)計(jì)至關(guān)重要。

2018-06-22 03:34:00

4161

10個(gè)Java編程中異常處理最佳實(shí)踐

這里是我收集的10個(gè)Java編程中進(jìn)行異常處理的10最佳實(shí)踐。在Java編程中對(duì)于檢查異常有褒有貶，強(qiáng)制處理異常是一門語(yǔ)言的功能。在本文中，我們將盡量減少使用檢查型異常，同時(shí)學(xué)會(huì)在Java編程中使用檢查型VS非檢查型異常。

2020-05-03 17:49:00

1739

PLC編程的語(yǔ)言種類及特點(diǎn)

PLC編程語(yǔ)言主要由兩大類：一是采用字符表達(dá)方式的編程語(yǔ)言，二是采用圖形符號(hào)表達(dá)方式的編程語(yǔ)言。

2020-05-03 17:43:00

3583

40年后C++為何仍然當(dāng)今使用最廣泛的編程語(yǔ)言之一？

強(qiáng)大、靈活、復(fù)雜：C++ 的起源可以追溯到 40 年前，但它仍然是當(dāng)今使用最廣泛的編程語(yǔ)言之一。為了找出原因，TechRepublic 采訪了 C++ 之父 Bjarne Stroustrup

2021-02-15 11:18:00

2512

Visual C串口通信技術(shù)與編程實(shí)踐

Visual C串口通信技術(shù)與編程實(shí)踐說(shuō)明。

2021-03-23 09:43:02

7個(gè)維度和43條使用規(guī)范，聊一聊Redis的最佳實(shí)踐

這篇文章我想和你聊一聊 Redis 的最佳實(shí)踐。你的項(xiàng)目或許已經(jīng)使用 Redis 很長(zhǎng)時(shí)間了，但在使用過(guò)程中，你可能還會(huì)或多或少地遇到以下問(wèn)題：我的 Redis 內(nèi)存為什么增長(zhǎng)這么

2021-03-30 10:40:07

1461

全面分析Redis的最佳實(shí)踐優(yōu)化

2021-04-26 10:51:53

1569

JAVA并發(fā)編程實(shí)踐

JAVA并發(fā)編程實(shí)踐資料免費(fèi)下載。

2021-06-01 15:31:55

Verilog是編程語(yǔ)言嗎

知乎上刷到一個(gè)問(wèn)題，問(wèn)性能最強(qiáng)的編程語(yǔ)言是什么？看到高贊回答到是Verilog，然后在評(píng)論區(qū)就引發(fā)了一場(chǎng)Verilog到底算不算編程語(yǔ)言的爭(zhēng)論，我覺(jué)得比較有意思，所以就也打算嘮嘮這個(gè)事情。趁著最近

2021-08-23 14:30:49

5560

C語(yǔ)言程序實(shí)踐--ACM入門

C語(yǔ)言程序實(shí)踐--ACM入門(開(kāi)關(guān)電源技術(shù)發(fā)展綜述)-該文檔為C語(yǔ)言程序實(shí)踐--ACM入門講解文檔，是一份不錯(cuò)的參考資料，感興趣的可以下載看看，，，，，，，，，，，，，，，，，

2021-09-22 17:42:31

單片機(jī)c語(yǔ)言+編程c語(yǔ)言_C編程語(yǔ)言簡(jiǎn)介

單片機(jī)c語(yǔ)言+編程c語(yǔ)言In this tutorial you will get basic introduction to C programming language. 在本教程中，您將獲得

2021-11-29 10:21:14

響應(yīng)式編程在Android開(kāi)發(fā)中的實(shí)踐

Flow 是一種基于流的編程模型，本文我們將向大家介紹響應(yīng)式編程以及其在 Android 開(kāi)發(fā)中的實(shí)踐，您將了解到如何將生命周期、旋轉(zhuǎn)及切換到后臺(tái)等狀態(tài)綁定到 Flow 中，并且測(cè)試它們是否能按照預(yù)期執(zhí)行。

2022-04-02 14:07:14

1422

Redis基礎(chǔ)架構(gòu)設(shè)計(jì)及核心網(wǎng)絡(luò)模型架構(gòu)演進(jìn)

性能優(yōu)異的服務(wù)離不開(kāi)好的架構(gòu)設(shè)計(jì)，Redis使用 I/O multiplexing 實(shí)現(xiàn)了單線程接收海量客戶端請(qǐng)求；通過(guò)單線程Reactor模型實(shí)現(xiàn)了高性能的事件處理

2022-10-11 15:08:05

305

ST語(yǔ)言編程手冊(cè)

介紹ST語(yǔ)言編程與使用

2022-10-24 14:36:05

手?jǐn)]了個(gè)Redis分布式鎖

實(shí)現(xiàn)分布式鎖的方式有很多，其中 Redis 是最常見(jiàn)的一種。而相較于 Java + Redis 的方案，我個(gè)人更傾向于 Go+Redis，從編程難易程度上來(lái)說(shuō)，要簡(jiǎn)單得多。

2022-11-03 14:44:22

440

以Python編程語(yǔ)言為例介紹編程語(yǔ)言

編程語(yǔ)言是研發(fā)人員與計(jì)算機(jī)交流的工具，計(jì)算機(jī)中的程序和軟件均通過(guò)編程語(yǔ)言編寫。

2023-02-09 10:11:22

946

深入探究Redis存儲(chǔ)原理

**Redis是用C語(yǔ)言開(kāi)發(fā)的一個(gè)開(kāi)源的高性能鍵值對(duì)（key-value）內(nèi)存數(shù)據(jù)庫(kù)。** **Redis數(shù)據(jù)存儲(chǔ)原理**

2023-02-15 15:52:38

484

Redis實(shí)現(xiàn)限流的三種方式分享

當(dāng)然，限流有許多種實(shí)現(xiàn)的方式，Redis具有很強(qiáng)大的功能，我用Redis實(shí)踐了三種的實(shí)現(xiàn)方式，可以較為簡(jiǎn)單的實(shí)現(xiàn)其方式。

2023-02-22 09:52:10

599

探究Redis網(wǎng)絡(luò)模型究竟有多強(qiáng)大（上）

本文將從BIO開(kāi)始介紹，經(jīng)過(guò)NIO、多路復(fù)用，最終說(shuō)回Redis的Reactor模型，力求詳盡。本文與其他文章的不同點(diǎn)主要在于：

2023-03-03 09:46:02

276

PLC編程語(yǔ)言的國(guó)際標(biāo)準(zhǔn) 和C語(yǔ)言的區(qū)別

　　PLC編程語(yǔ)言是工業(yè)控制領(lǐng)域內(nèi)用于編寫PLC程序的語(yǔ)言，旨在實(shí)現(xiàn)對(duì)工業(yè)設(shè)備和生產(chǎn)流程的自動(dòng)化控制和監(jiān)測(cè)。PLC編程語(yǔ)言包含多種語(yǔ)言類型，如圖形化編程語(yǔ)言、文本化編程語(yǔ)言、結(jié)構(gòu)化編程語(yǔ)言等，可根據(jù)不同應(yīng)用場(chǎng)景和編程需求進(jìn)行選擇和組合。C語(yǔ)言是一種通用計(jì)算機(jī)編程語(yǔ)言。以下是它們之間的主要區(qū)別：

2023-03-17 17:13:28

3901

西門子PLC編程語(yǔ)言介紹

PLC目前有5種標(biāo)準(zhǔn)的編程語(yǔ)言，包括圖形化編程語(yǔ)言和文本化編程語(yǔ)言。

2023-04-15 14:13:12

1214

PLC各種編程語(yǔ)言特點(diǎn)

編程語(yǔ)言種類很多，各有各的優(yōu)勢(shì)，語(yǔ)句表和指令表類似，是編程語(yǔ)言的一種，在PLC中應(yīng)用比較普遍，也是一種高級(jí)編程語(yǔ)言，PLC中語(yǔ)句表、梯形圖、SCL等編程語(yǔ)言的特點(diǎn)：

2023-04-20 09:55:44

什么是 Redis

? — ? 1 ?— 什么是 Redis？ Redis（REmote DIctionary Service）是一個(gè)開(kāi)源的鍵值對(duì)數(shù)據(jù)庫(kù)服務(wù)器。 Redis 更準(zhǔn)確的描述是一個(gè)數(shù)據(jù)結(jié)構(gòu)服務(wù)器。Redis

2023-05-22 15:32:57

564

Redis的主從、哨兵、Redis Cluster集群

? 前言今天跟小伙伴們一起學(xué)習(xí)Redis的主從、哨兵、Redis Cluster集群。 Redis主從 Redis哨兵 Redis Cluster集群基于 Spring Boot

2023-06-12 14:58:19

443

基于PASCAL的高級(jí)編程語(yǔ)言——SCL編程語(yǔ)言

根據(jù)該標(biāo)準(zhǔn)，可對(duì)用于可編程邏輯控制器的編程語(yǔ)言進(jìn)行標(biāo)準(zhǔn)化。SCL 編程語(yǔ)言實(shí)現(xiàn)了該標(biāo)準(zhǔn)中定義的 ST 語(yǔ)言 (結(jié)構(gòu)化文本) 的 PLCopen 初級(jí)水平。

2023-06-20 10:20:45

956

西門子PLC編程語(yǔ)言介紹

PLC目前有5種標(biāo)準(zhǔn)的編程語(yǔ)言，包括圖形化編程語(yǔ)言和文本化編程語(yǔ)言。

2023-06-29 16:00:29

825

PLC編程語(yǔ)言的特點(diǎn)

PLC的編程語(yǔ)言與一般計(jì)算機(jī)語(yǔ)言相比，具有明顯的特點(diǎn)，它既不同于高級(jí)語(yǔ)言，也不同與一般的匯編語(yǔ)言，它既要滿足易于編寫，又要滿足易于調(diào)試的要求。目前，還沒(méi)有一種對(duì)各廠家產(chǎn)品都能兼容的編程語(yǔ)言。如三菱

2023-07-04 17:13:42

514

機(jī)器學(xué)習(xí)構(gòu)建ML模型實(shí)踐

實(shí)踐中的機(jī)器學(xué)習(xí)：構(gòu)建 ML 模型

2023-07-05 16:30:36

412

語(yǔ)言模型的發(fā)展歷程基于神經(jīng)網(wǎng)絡(luò)的語(yǔ)言模型解析

簡(jiǎn)單來(lái)說(shuō)，語(yǔ)言模型能夠以某種方式生成文本。它的應(yīng)用十分廣泛，例如，可以用語(yǔ)言模型進(jìn)行情感分析、標(biāo)記有害內(nèi)容、回答問(wèn)題、概述文檔等等。但理論上，語(yǔ)言模型的潛力遠(yuǎn)超以上常見(jiàn)任務(wù)。

2023-07-14 11:45:40

454

TypeScript之父也搞大模型：推出TypeChat

C# 和 TypeScript 之父 Anders Hejlsberg 今天宣布了全新的開(kāi)源項(xiàng)目 ——TypeChat，它通過(guò) AI 在自然語(yǔ)言和應(yīng)用程序模式 (application schema)，以及 API 之間構(gòu)建了一座 “橋梁”，能用新穎有趣的方式使用 TypeScript。

2023-07-24 09:27:06

541

中譯語(yǔ)通展示格物多語(yǔ)言大模型技術(shù)和工業(yè)實(shí)踐

大模型技術(shù)和工業(yè)實(shí)踐。會(huì)議還匯聚了騰訊AI Lab、百度等科技企業(yè),學(xué)術(shù)界和工業(yè)界的研究學(xué)者與從業(yè)人員,分享各自研究成果和實(shí)踐經(jīng)驗(yàn),推動(dòng)了大模型和自然語(yǔ)言生成領(lǐng)域的技術(shù)創(chuàng)新與研究成果轉(zhuǎn)化。中譯語(yǔ)通作為NLGIW戰(zhàn)略合作伙伴參會(huì)展示本屆會(huì)議組織單位為中國(guó)中文

2023-07-27 09:44:38

365

五種支持plc編程的語(yǔ)言有哪些

在PLC控制系統(tǒng)設(shè)計(jì)中，不同型號(hào)的PLC編程軟件對(duì)以上五種編程語(yǔ)言的支持種類是不同的，所以不但對(duì)PLC的硬件性能了解外，也要了解PLC對(duì)編程語(yǔ)言支持的種類。

2023-08-31 14:54:15

634

騰訊發(fā)布混元大語(yǔ)言模型

騰訊發(fā)布混元大語(yǔ)言模型騰訊全球數(shù)字生態(tài)大會(huì)上騰訊正式發(fā)布了混元大語(yǔ)言模型，參數(shù)規(guī)模超千億，預(yù)訓(xùn)練語(yǔ)料超2萬(wàn)億tokens。作為騰訊自研的通用大語(yǔ)言模型，混元大語(yǔ)言模型具有中文創(chuàng)作能力、任務(wù)執(zhí)行

2023-09-07 10:23:54

815

虹科分享 | 谷歌Vertex AI平臺(tái)使用Redis搭建大語(yǔ)言模型

基礎(chǔ)模型和高性能數(shù)據(jù)層這兩個(gè)基本組件始終是創(chuàng)建高效、可擴(kuò)展語(yǔ)言模型應(yīng)用的關(guān)鍵，利用Redis搭建大語(yǔ)言模型，能夠?qū)崿F(xiàn)高效可擴(kuò)展的語(yǔ)義搜索、檢索增強(qiáng)生成、LLM 緩存機(jī)制、LLM記憶和持久

2023-09-18 11:26:49

316

如何用Springboot整合Redis

本篇文件我們來(lái)介紹如何用Springboot整合Redis。 1、Docker 安裝 Redis 1.1 下載鏡像 docker pull redis: 6 . 2 . 6 1.2 創(chuàng)建配置文件

2023-10-08 14:56:52

293

怎樣使用FHE實(shí)現(xiàn)加密大語(yǔ)言模型？

近來(lái)，大語(yǔ)言模型 (LLM) 已被證明是提高編程、內(nèi)容生成、文本分析、網(wǎng)絡(luò)搜索及遠(yuǎn)程學(xué)習(xí)等諸多領(lǐng)域生產(chǎn)力的可靠工具。

2023-10-19 09:13:57

410

redis與mysql的區(qū)別

Redis與MySQL是兩種常見(jiàn)的數(shù)據(jù)庫(kù)管理系統(tǒng)，兩者在很多方面存在差異，本文將詳細(xì)分析Redis與MySQL的區(qū)別。數(shù)據(jù)模型： Redis是一種基于鍵值對(duì)的NoSQL數(shù)據(jù)庫(kù)，它將數(shù)據(jù)存儲(chǔ)為鍵值

2023-11-16 11:21:11

398

腳本語(yǔ)言和編程語(yǔ)言的區(qū)別

腳本語(yǔ)言和編程語(yǔ)言是計(jì)算機(jī)語(yǔ)言的兩個(gè)主要分類。盡管兩者都是用于編寫計(jì)算機(jī)程序的工具，但它們?cè)谠O(shè)計(jì)和運(yùn)行方式上存在一些顯著的區(qū)別。下面將詳細(xì)探討腳本語(yǔ)言和編程語(yǔ)言之間的區(qū)別。定義：腳本語(yǔ)言

2023-11-22 14:33:14

1070

Java redis鎖怎么實(shí)現(xiàn)

在Java中實(shí)現(xiàn)Redis鎖涉及到以下幾個(gè)方面：Redis的安裝配置、Redis連接池的使用、Redis數(shù)據(jù)結(jié)構(gòu)的選擇、實(shí)現(xiàn)分布式鎖的幾種方式等。一、Redis的安裝配置下載Redis并解壓縮

2023-12-04 10:47:57

295

java redis鎖處理并發(fā)代碼

在并發(fā)編程中，一個(gè)常見(jiàn)的問(wèn)題是如何確保多個(gè)線程安全地訪問(wèn)共享資源，避免產(chǎn)生競(jìng)態(tài)條件和數(shù)據(jù)異常。而Redis作為一種高性能的內(nèi)存數(shù)據(jù)庫(kù)，可以提供分布式鎖的功能，通過(guò)Redis鎖，我們可以有效地解決并發(fā)

2023-12-04 11:04:24

239

redis連接數(shù)配置多少合適

Redis 是一款高性能的內(nèi)存數(shù)據(jù)庫(kù)，廣泛應(yīng)用于緩存、消息隊(duì)列、會(huì)話存儲(chǔ)等場(chǎng)景。在配置 Redis 連接數(shù)時(shí)，需要根據(jù)實(shí)際情況綜合考慮一系列因素，如服務(wù)器硬件規(guī)格、業(yè)務(wù)負(fù)載、并發(fā)訪問(wèn)量、數(shù)據(jù)模型

2023-12-04 11:31:58

357

大語(yǔ)言模型簡(jiǎn)介：基于大語(yǔ)言模型模型全家桶Amazon Bedrock

本文基于亞馬遜云科技推出的大語(yǔ)言模型與生成式AI的全家桶：Bedrock對(duì)大語(yǔ)言模型進(jìn)行介紹。大語(yǔ)言模型指的是具有數(shù)十億參數(shù)（B+）的預(yù)訓(xùn)練語(yǔ)言模型（例如：GPT-3, Bloom, LLaMA)。這種模型可以用于各種自然語(yǔ)言處理任務(wù)，如文本生成、機(jī)器翻譯和自然語(yǔ)言理解等。

2023-12-04 15:51:46

356

redis容器部署并用編程演示sb整合

Redis，并通過(guò)編程演示 Spring Boot 如何整合 Redis。 Redis 容器部署 Redis 可以通過(guò)容器部署，我們可以使用 Docker 來(lái)創(chuàng)建 Redis 容器。以下是在 Docker

2023-12-05 10:08:42

173

redis容器內(nèi)怎么查看redis日志

redis是一款流行的開(kāi)源內(nèi)存數(shù)據(jù)庫(kù)，常用于緩存、消息隊(duì)列、任務(wù)管理等場(chǎng)景。在使用redis時(shí)，了解如何查看redis日志對(duì)于排查問(wèn)題、監(jiān)控性能和分析應(yīng)用程序行為非常重要。在本文中，我們將介紹

2023-12-05 10:10:24

1010

redis是關(guān)系型數(shù)據(jù)庫(kù)嗎

Server）是一個(gè)開(kāi)源的高性能鍵值對(duì)存儲(chǔ)系統(tǒng)。它使用C語(yǔ)言編寫，具有內(nèi)存中數(shù)據(jù)存儲(chǔ)和持久化到硬盤的功能。Redis支持多種數(shù)據(jù)結(jié)構(gòu)，如字符串、哈希表、列表、集合和有序集合等，這使得它可以應(yīng)對(duì)各種類型的應(yīng)用需求。 Redis的特點(diǎn)之一是高性能。由于數(shù)據(jù)存儲(chǔ)在內(nèi)存中，Redis可以快速讀寫

2023-12-05 10:32:51

458

redis高并發(fā)能力直接相關(guān)概念有哪些

請(qǐng)求和響應(yīng)，這意味著它可以同時(shí)處理多個(gè)客戶端請(qǐng)求，而不需要等待每個(gè)請(qǐng)求的完成。這種機(jī)制是通過(guò)使用事件驅(qū)動(dòng)的編程模型和底層的網(wǎng)絡(luò)庫(kù)來(lái)實(shí)現(xiàn)的。非阻塞IO可以大大提高Redis的并發(fā)能力。多線程：Redis支持多線程來(lái)處理客戶端請(qǐng)求。當(dāng)一個(gè)客戶端請(qǐng)求到達(dá)

2023-12-05 10:34:31

181

大語(yǔ)言模型概述

在科技飛速發(fā)展的當(dāng)今時(shí)代，人工智能技術(shù)成為社會(huì)進(jìn)步的關(guān)鍵推動(dòng)力之一。在廣泛關(guān)注的人工智能領(lǐng)域中，大語(yǔ)言模型以其引人注目的特性備受矚目。大語(yǔ)言模型的定義及發(fā)展歷史大語(yǔ)言模型是一類基于深度學(xué)習(xí)技術(shù)

2023-12-21 17:53:59

555

大語(yǔ)言模型使用指南

在信息爆炸的時(shí)代，我們渴望更智能、更高效的語(yǔ)言處理工具。GPT-3.5等大語(yǔ)言模型的崛起為我們提供了前所未有的機(jī)會(huì)。這不僅是技術(shù)的進(jìn)步，更是人與機(jī)器共舞的一幕。本篇文章將帶你走進(jìn)這個(gè)奇妙的語(yǔ)言王國(guó)

2023-12-29 14:18:59

276

plc編程語(yǔ)言與c語(yǔ)言的聯(lián)系 c語(yǔ)言和PLC有什么區(qū)別

PLC編程語(yǔ)言與C語(yǔ)言的聯(lián)系 PLC（可編程邏輯控制器）是一種針對(duì)自動(dòng)化控制系統(tǒng)的特殊計(jì)算機(jī)。PLC編程語(yǔ)言是為了控制和管理自動(dòng)化生產(chǎn)過(guò)程中的各種設(shè)備而設(shè)計(jì)的。與之相比，C語(yǔ)言是一種通用的高級(jí)編程

2024-02-05 14:21:07

533

已全部加載完成

搜索歷史

Redis之父的大語(yǔ)言模型編程實(shí)踐

評(píng)論