探索LangChain：構(gòu)建專屬LLM應(yīng)用的基石

一、LangChain是什么

LangChain是一個框架，用于開發(fā)由LLM驅(qū)動的應(yīng)用程序。可以簡單認為是LLM領(lǐng)域的Spring，以及開源版的ChatGPT插件系統(tǒng)。核心的2個功能為：

1）可以將 LLM 模型與外部數(shù)據(jù)源進行連接。

2）允許與 LLM 模型與環(huán)境進行交互，通過Agent使用工具。

二、LangChain核心組件

LangChain提供了各種不同的組件幫助使用LLM，如下圖所示，核心組件有Models、Indexes、Chains、Memory以及Agent。

??2.1 Models

LangChain本身不提供LLM，提供通用的接口訪問LLM，可以很方便的更換底層的LLM以及自定義自己的LLM。主要有2大類的Models：

1）LLM：將文本字符串作為輸入并返回文本字符串的模型，類似OpenAI的text-davinci-003

2）Chat Models：由語言模型支持但將聊天消息列表作為輸入并返回聊天消息的模型。一般使用的ChatGPT以及Claude為Chat Models。

與模型交互的，基本上是通過給予Prompt的方式，LangChain通過PromptTemplate的方式方便我們構(gòu)建以及復(fù)用Prompt。

from langchain import PromptTemplate


prompt_template = '''作為一個資深編輯，請針對 >>> 和 <<< 中間的文本寫一段摘要。 
>>> {text} <<<
'''


prompt = PromptTemplate(template=prompt_template, input_variables=["text"])
print(prompt.format_prompt(text="我愛北京天安門"))

2.2 Indexes

索引和外部數(shù)據(jù)進行集成，用于從外部數(shù)據(jù)獲取答案。如下圖所示，主要的步驟有

1）通過Document Loaders加載各種不同類型的數(shù)據(jù)源,

2）通過Text Splitters進行文本語義分割

3）通過Vectorstore進行非結(jié)構(gòu)化數(shù)據(jù)的向量存儲

4）通過Retriever進行文檔數(shù)據(jù)檢索

2.2.1 Document Loaders

LangChain通過Loader加載外部的文檔，轉(zhuǎn)化為標準的Document類型。Document類型主要包含兩個屬性：page_content 包含該文檔的內(nèi)容。meta_data 為文檔相關(guān)的描述性數(shù)據(jù)，類似文檔所在的路徑等。

??2.2.2 Text Splitters

LLM一般都會限制上下文窗口的大小，有4k、16k、32k等。針對大文本就需要進行文本分割，常用的文本分割器為RecursiveCharacterTextSplitter，可以通過separators指定分隔符。其先通過第一個分隔符進行分割，不滿足大小的情況下迭代分割。

文本分割主要有2個考慮：

1）將語義相關(guān)的句子放在一塊形成一個chunk。一般根據(jù)不同的文檔類型定義不同的分隔符，或者可以選擇通過模型進行分割。

2）chunk控制在一定的大小，可以通過函數(shù)去計算。默認通過len函數(shù)計算，模型內(nèi)部一般都是使用token進行計算。token通常指的是將文本或序列數(shù)據(jù)劃分成的小的單元或符號，便于機器理解和處理。使用OpenAI相關(guān)的大模型，可以通過tiktoken包去計算其token大小。

from langchain.text_splitter import RecursiveCharacterTextSplitter


text_splitter = RecursiveCharacterTextSplitter.from_tiktoken_encoder(
    model_name="gpt-3.5-turb
    allowed_special="all",
    separators=["

", "
", "。", "，"],
    chunk_size=7000,
    chunk_overlap=0
)
docs = text_splitter.create_documents(["文本在這里"])
print(docs)

2.2.3 Vectorstore

通過Text Embedding models，將文本轉(zhuǎn)為向量，可以進行語義搜索，在向量空間中找到最相似的文本片段。目前支持常用的向量存儲有Faiss、Chroma等。

Embedding模型支持OpenAIEmbeddings、HuggingFaceEmbeddings等。通過HuggingFaceEmbeddings加載本地模型可以節(jié)省embedding的調(diào)用費用。

#通過cache_folder加載本地模型
embeddings = HuggingFaceEmbeddings(model_name="text2vec-base-chinese", cache_folder="本地模型地址")


embeddings = embeddings_model.embed_documents(
    [
        "我愛北京天安門!",
        "Hello world!"
    ]
)

2.2.4 Retriever

Retriever接口用于根據(jù)非結(jié)構(gòu)化的查詢獲取文檔，一般情況下是文檔存儲在向量數(shù)據(jù)庫中?？梢哉{(diào)用 get_relevant_documents 方法來檢索與查詢相關(guān)的文檔。

from langchain import FAISS
from langchain.document_loaders import WebBaseLoader
from langchain.embeddings import HuggingFaceEmbeddings
from langchain.text_splitter import RecursiveCharacterTextSplitter


loader = WebBaseLoader("https://in.m.jd.com/help/app/register_info.html")
data = loader.load()
text_splitter = RecursiveCharacterTextSplitter.from_tiktoken_encoder(
    model_name="gpt-3.5-turbo",
    allowed_special="all",
    separators=["

", "
", "。", "，"],
    chunk_size=800,
    chunk_overlap=0
)
docs = text_splitter.split_documents(data)
#通過cache_folder設(shè)置自己的本地模型路徑
embeddings = HuggingFaceEmbeddings(model_name="text2vec-base-chinese", cache_folder="models")
vectorstore = FAISS.from_documents(docs, embeddings)
result = vectorstore.as_retriever().get_relevant_documents("用戶注冊資格")
print(result)
print(len(result))

2.3 Chains

Langchain通過chain將各個組件進行鏈接，以及chain之間進行鏈接，用于簡化復(fù)雜應(yīng)用程序的實現(xiàn)。其中主要有LLMChain、Sequential Chain以及Route Chain

2.3.1 LLMChain

最基本的鏈為LLMChain，由PromptTemplate、LLM和OutputParser組成。LLM的輸出一般為文本，OutputParser用于讓LLM結(jié)構(gòu)化輸出并進行結(jié)果解析，方便后續(xù)的調(diào)用。

類似下面的示例，給評論進行關(guān)鍵詞提前以及情緒分析，通過LLMChain組合PromptTemplate、LLM以及OutputParser，可以很簡單的實現(xiàn)一個之前通過依賴小模型不斷需要調(diào)優(yōu)的事情。

from langchain.chains import LLMChain
from langchain.prompts import PromptTemplate
from langchain.output_parsers import ResponseSchema, StructuredOutputParser
from azure_chat_llm import llm


#output parser
keyword_schema = ResponseSchema(name="keyword", description="評論的關(guān)鍵詞列表")
emotion_schema = ResponseSchema(name="emotion", description="評論的情緒，正向為1，中性為0，負向為-1")
response_schemas = [keyword_schema, emotion_schema]
output_parser = StructuredOutputParser.from_response_schemas(response_schemas)
format_instructions = output_parser.get_format_instructions()


#prompt template
prompt_template_txt = '''
作為資深客服，請針對 >>> 和 <<< 中間的文本識別其中的關(guān)鍵詞，以及包含的情緒是正向、負向還是中性。
>>> {text} <<<
RESPONSE:
{format_instructions}
'''


prompt = PromptTemplate(template=prompt_template_txt, input_variables=["text"],
                        partial_variables={"format_instructions": format_instructions})


#llmchain
llm_chain = LLMChain(prompt=prompt, llm=llm)
comment = "京東物流沒的說，速度態(tài)度都是杠杠滴！這款路由器顏值賊高，怎么說呢，就是泰褲辣！這線條，這質(zhì)感，這速度，嘎嘎快！以后媽媽再也不用擔心家里的網(wǎng)速了！"
result = llm_chain.run(comment)
data = output_parser.parse(result)
print(f"type={type(data)}, keyword={data['keyword']}, emotion={data['emotion']}")

輸出：

2.3.2 Sequential Chain

SequentialChains是按預(yù)定義順序執(zhí)行的鏈。SimpleSequentialChain為順序鏈的最簡單形式，其中每個步驟都有一個單一的輸入/輸出，一個步驟的輸出是下一個步驟的輸入。SequentialChain 為順序鏈更通用的形式，允許多個輸入/輸出。

from langchain.chains import LLMChain
from langchain.prompts import PromptTemplate
from langchain.chains import SimpleSequentialChain


first_prompt = PromptTemplate.from_template(
    "翻譯下面的內(nèi)容到中文:"
    "

{content}"
)
# chain 1: 輸入：Review 輸出： 英文的 Review
chain_trans = LLMChain(llm=llm, prompt=first_prompt, output_key="content_zh")


second_prompt = PromptTemplate.from_template(
    "一句話總結(jié)下面的內(nèi)容:"
    "

{content_zh}"
)


chain_summary = LLMChain(llm=llm, prompt=second_prompt)
overall_simple_chain = SimpleSequentialChain(chains=[chain_trans, chain_summary],verbose=True)
content = '''In a blog post authored back in 2011, Marc Andreessen warned that, “Software is eating the world.” Over a decade later, we are witnessing the emergence of a new type of technology that’s consuming the world with even greater voracity: generative artificial intelligence (AI). This innovative AI includes a unique class of large language models (LLM), derived from a decade of groundbreaking research, that are capable of out-performing humans at certain tasks. And you don’t have to have a PhD in machine learning to build with LLMs—developers are already building software with LLMs with basic HTTP requests and natural language prompts.
In this article, we’ll tell the story of GitHub’s work with LLMs to help other developers learn how to best make use of this technology. This post consists of two main sections: the first will describe at a high level how LLMs function and how to build LLM-based applications. The second will dig into an important example of an LLM-based application: GitHub Copilot code completions.
Others have done an impressive job of cataloging our work from the outside. Now, we’re excited to share some of the thought processes that have led to the ongoing success of GitHub Copilot.
'''
result = overall_simple_chain.run(content)
print(f'result={result}')

輸出：

2.3.3 Router Chain

RouterChain是根據(jù)輸入動態(tài)的選擇下一個鏈，每條鏈處理特定類型的輸入。

RouterChain由兩個組件組成：

1）路由器鏈本身，負責選擇要調(diào)用的下一個鏈，主要有2種RouterChain，其中LLMRouterChain通過LLM進行路由決策，EmbeddingRouterChain 通過向量搜索的方式進行路由決策。

2）目標鏈列表，路由器鏈可以路由到的子鏈。

初始化RouterChain以及destination_chains完成后，通過MultiPromptChain將兩者結(jié)合起來使用。

??2.3.4 Documents Chain

下面的4種Chain主要用于Document的處理，在基于文檔生成摘要、基于文檔的問答等場景中經(jīng)常會用到，在后續(xù)的落地實踐里也會有所體現(xiàn)。

2.3.4.1 Stuff

StuffDocumentsChain這種鏈最簡單直接，是將所有獲取到的文檔作為context放入到Prompt中，傳遞到LLM獲取答案。

這種方式可以完整的保留上下文，調(diào)用LLM的次數(shù)也比較少，建議能使用stuff的就使用這種方式。其適合文檔拆分的比較小，一次獲取文檔比較少的場景，不然容易超過token的限制。

??2.3.4.2 Refine

RefineDocumentsChain是通過迭代更新的方式獲取答案。先處理第一個文檔，作為context傳遞給llm，獲取中間結(jié)果intermediate answer。然后將第一個文檔的中間結(jié)果以及第二個文檔發(fā)給llm進行處理，后續(xù)的文檔類似處理。

Refine這種方式能部分保留上下文，以及token的使用能控制在一定范圍。

??2.3.4.3 MapReduce

MapReduceDocumentsChain先通過LLM對每個document進行處理，然后將所有文檔的答案在通過LLM進行合并處理，得到最終的結(jié)果。

MapReduce的方式將每個document單獨處理，可以并發(fā)進行調(diào)用。但是每個文檔之間缺少上下文。

2.3.4.4 MapRerank

MapRerankDocumentsChain和MapReduceDocumentsChain類似，先通過LLM對每個document進行處理，每個答案都會返回一個score，最后選擇score最高的答案。

MapRerank和MapReduce類似，會大批量地調(diào)用LLM，每個document之間是獨立處理。

??2.4 Memory

正常情況下Chain無狀態(tài)的，每次交互都是獨立的，無法知道之前歷史交互的信息。LangChain使用Memory組件保存和管理歷史消息，這樣可以跨多輪進行對話，在當前會話中保留歷史會話的上下文。Memory組件支持多種存儲介質(zhì)，可以與Monogo、Redis、SQLite等進行集成，以及簡單直接形式就是Buffer Memory。常用的Buffer Memory有

1）ConversationSummaryMemory ：以摘要的信息保存記錄

2）ConversationBufferWindowMemory：以原始形式保存最新的n條記錄

3）ConversationBufferMemory：以原始形式保存所有記錄

通過查看chain的prompt，可以發(fā)現(xiàn){history}變量傳遞了從memory獲取的會話上下文。下面的示例演示了Memory的使用方式，可以很明細看到，答案是從之前的問題里獲取的。

from langchain.chains import ConversationChain
from langchain.memory import ConversationBufferMemory


from azure_chat_llm import llm


memory = ConversationBufferMemory()
conversation = ConversationChain(llm=llm, memory=memory, verbose=True)
print(conversation.prompt)
print(conversation.predict(input="我的姓名是tiger"))
print(conversation.predict(input="1+1=?"))
print(conversation.predict(input="我的姓名是什么"))

輸出：

??2.5 Agent

Agent字面含義就是代理，如果說LLM是大腦，Agent就是代理大腦使用工具Tools。目前的大模型一般都存在知識過時、邏輯計算能力低等問題，通過Agent訪問工具，可以去解決這些問題。目前這個領(lǐng)域特別活躍，誕生了類似AutoGPT、BabyAGI、AgentGPT等一堆優(yōu)秀的項目。傳統(tǒng)使用LLM，需要給定Prompt一步一步地達成目標，通過Agent是給定目標，其會自動規(guī)劃并達到目標。

2.5.1 Agent核心組件

Agent：代理，負責調(diào)用LLM以及決定下一步的Action。其中LLM的prompt必須包含agent_scratchpad變量，記錄執(zhí)行的中間過程

Tools：工具，Agent可以調(diào)用的方法。LangChain已有很多內(nèi)置的工具，也可以自定義工具。注意Tools的description屬性，LLM會通過描述決定是否使用該工具。

ToolKits：工具集，為特定目的的工具集合。類似Office365、Gmail工具集等

Agent Executor：Agent執(zhí)行器，負責進行實際的執(zhí)行。

2.5.2 Agent的類型

一般通過initialize_agent函數(shù)進行Agent的初始化，除了llm、tools等參數(shù)，還需要指定AgentType。

agent = initialize_agent(agent=AgentType.ZERO_SHOT_REACT_DESCRIPTION,
                tools=tools,
                llm=llm,
                verbose=True)
print(agent.agent.llm_chain.prompt.template)

該Agent為一個zero-shot-react-description類型的Agent，其中zero-shot表明只考慮當前的操作，不會記錄以及參考之前的操作。react表明通過ReAct框架進行推理，description表明通過工具的description進行是否使用的決策。

其他的類型還有chat-conversational-react-description、conversational-react-description、react-docstore、self-ask-with-search等，類似chat-conversational-react-description通過memory記錄之前的對話，應(yīng)答會參考之前的操作。

可以通過agent.agent.llm_chain.prompt.template方法，獲取其推理決策所使用的模板。

2.5.3 自定義Tool

有多種方式可以自定義Tool，最簡單的方式是通過@tool裝飾器，將一個函數(shù)轉(zhuǎn)為Tool。注意函數(shù)必須得有docString，其為Tool的描述。

from azure_chat_llm import llm
from langchain.agents import load_tools, initialize_agent, tool
from langchain.agents.agent_types import AgentType
from datetime import date


@tool
def time(text: str) -> str:
    """
    返回今天的日期。
    """
    return str(date.today())




tools = load_tools(['llm-math'], llm=llm)
tools.append(time)
agent_math = initialize_agent(agent=AgentType.ZERO_SHOT_REACT_DESCRIPTION,
                                   tools=tools,
                                   llm=llm,
                                   verbose=True)
print(agent_math("計算45 * 54"))
print(agent_math("今天是哪天？"))

輸出為：

三、LangChain落地實踐

3.1 文檔生成總結(jié)

1）通過Loader加載遠程文檔

2）通過Splitter基于Token進行文檔拆分

3）加載summarize鏈，鏈類型為refine，迭代進行總結(jié)

from langchain.prompts import PromptTemplate
from langchain.document_loaders import PlaywrightURLLoader
from langchain.chains.summarize import load_summarize_chain
from langchain.text_splitter import RecursiveCharacterTextSplitter
from azure_chat_llm import llm


loader = PlaywrightURLLoader(urls=["https://content.jr.jd.com/article/index.html?pageId=708258989"])
data = loader.load()


text_splitter = RecursiveCharacterTextSplitter.from_tiktoken_encoder(
    model_name="gpt-3.5-turbo",
    allowed_special="all",
    separators=["

", "
", "。", "，"],
    chunk_size=7000,
    chunk_overlap=0
)


prompt_template = '''
作為一個資深編輯，請針對 >>> 和 <<< 中間的文本寫一段摘要。 
>>> {text} <<<
'''
refine_template = '''
作為一個資深編輯，基于已有的一段摘要：{existing_answer}，針對 >>> 和 <<< 中間的文本完善現(xiàn)有的摘要。 
>>> {text} <<<
'''


PROMPT = PromptTemplate(template=prompt_template, input_variables=["text"])
REFINE_PROMPT = PromptTemplate(
    template=refine_template, input_variables=["existing_answer", "text"]
)


chain = load_summarize_chain(llm, chain_type="refine", question_prompt=PROMPT, refine_prompt=REFINE_PROMPT, verbose=False)


docs = text_splitter.split_documents(data)
result = chain.run(docs)
print(result)

3.2 基于外部文檔的問答

1）通過Loader加載遠程文檔

2）通過Splitter基于Token進行文檔拆分

3）通過FAISS向量存儲文檔，embedding加載HuggingFace的text2vec-base-chinese模型

4）自定義QA的prompt，通過RetrievalQA回答相關(guān)的問題

from langchain.chains import RetrievalQA
from langchain.document_loaders import WebBaseLoader
from langchain.embeddings.huggingface import HuggingFaceEmbeddings
from langchain.prompts import PromptTemplate
from langchain.text_splitter import RecursiveCharacterTextSplitter
from langchain.vectorstores import FAISS


from azure_chat_llm import llm


loader = WebBaseLoader("https://in.m.jd.com/help/app/register_info.html")
data = loader.load()
text_splitter = RecursiveCharacterTextSplitter.from_tiktoken_encoder(
    model_name="gpt-3.5-turbo",
    allowed_special="all",
    separators=["

", "
", "。", "，"],
    chunk_size=800,
    chunk_overlap=0
)
docs = text_splitter.split_documents(data)
#設(shè)置自己的模型路徑
embeddings = HuggingFaceEmbeddings(model_name="text2vec-base-chinese", cache_folder="model")
vectorstore = FAISS.from_documents(docs, embeddings)


template = """請使用下面提供的背景信息來回答最后的問題。 如果你不知道答案，請直接說不知道，不要試圖憑空編造答案。
回答時最多使用三個句子，保持回答盡可能簡潔。 回答結(jié)束時，請一定要說"謝謝你的提問！"
{context}
問題: {question}
有用的回答:"""
QA_CHAIN_PROMPT = PromptTemplate(input_variables=["context", "question"], template=template)


qa_chain = RetrievalQA.from_chain_type(llm, retriever=vectorstore.as_retriever(),
                                       return_source_documents=True,
                                       chain_type_kwargs={"prompt": QA_CHAIN_PROMPT})


result = qa_chain({"query": "用戶注冊資格"})
print(result["result"])
print(len(result['source_documents']))

? ? 四、未來發(fā)展方向

隨著大模型的發(fā)展，LangChain應(yīng)該是目前最火的LLM開發(fā)框架，能和外部數(shù)據(jù)源交互、能集成各種常用的組件等等，大大降低了LLM應(yīng)用開發(fā)的門檻。其創(chuàng)始人Harrison Chase也和Andrew Ng聯(lián)合開發(fā)了2門短課程，幫忙大家快速掌握LangChain的使用。

目前大模型的迭代升級特別快，作為一個框架，LangChain也得保持特別快的迭代速度。其開發(fā)特別拼，每天都會提交大量的commit，基本隔幾天就會發(fā)布一個新版本，其Contributor也達到了1200多人，特別活躍。

個人認為，除了和業(yè)務(wù)結(jié)合落地LLM應(yīng)用外，還有2個大的方向可以進一步去探索：

1）通過低代碼的形式進一步降低LLM應(yīng)用的開發(fā)門檻。類似langflow這樣的可視化編排工具發(fā)展也很快

2）打造更加強大的Agent。Agent之于大模型，個人覺得類似SQL之于DB，能大幅度提升LLM的應(yīng)用場景

審核編輯：黃飛

閱讀全文

ChatGPT(3870) ChatGPT(3870)
LLM(229) LLM(229)

【比特熊充電?！繉崙?zhàn)演練構(gòu)建LLM對話引擎

Guardrails 與 Azure OpenAI 結(jié)合使用，構(gòu)建更加安全可靠的 LLM 對話引擎？本期【比特熊充電?！?NVIDIA 企業(yè)

2023-09-19 13:40:04

717

突破邊界：高性能計算引領(lǐng)LLM駛向通用人工智能AGI的創(chuàng)新紀元

ChatGPT的成功帶動整個AIGC產(chǎn)業(yè)的發(fā)展，尤其是LLM（大型語言模型，大語言模型）、NLP、高性能計算和深度學習等領(lǐng)域。LLM的發(fā)展將為全球和中國AI芯片、AI服務(wù)器市場的增長提供強勁動力，據(jù)估算，LLM將為全球和中國AI服務(wù)器帶來約891.2億美元和338.2億美元的市場空間。

2023-06-25 14:31:15

575

對比解碼在LLM上的應(yīng)用

為了改進LLM的推理能力，University of California聯(lián)合Meta AI實驗室提出將Contrastive Decoding應(yīng)用于多種任務(wù)的LLM方法。實驗表明，所提方法能有效改進LLM的推理能力。讓我們走進論文一探究竟吧！

2023-09-21 11:37:55

327

TensorRT-LLM初探（一）運行l(wèi)lama

TensorRT-LLM正式出來有半個月了，一直沒有時間玩，周末趁著有時間跑一下。

2023-11-16 17:39:34

772

基于ICL范式的LLM的最高置信度預(yù)測方案

本文假設(shè)不同的ICL為LLM提供了關(guān)于任務(wù)的不同知識，導(dǎo)致對相同數(shù)據(jù)的不同理解和預(yù)測。因此，一個直接的研究問題出現(xiàn)了:llm能否用多個ICL提示輸入來增強，以提供最可信的預(yù)測？為解決這個問題，本文提出上下文采樣(ICS)。ICS遵循三步流程:采樣、增強和驗證，如圖1所示。

2023-11-24 11:20:46

863

低比特量化技術(shù)如何幫助LLM提升性能

針對大語言模型 (LLM) 在部署過程中的性能需求，低比特量化技術(shù)一直是優(yōu)化效果最佳的方案之一，本文將探討低比特量化技術(shù)如何幫助 LLM 提升性能，以及新版 OpenVINO 對于低比特量化技術(shù)的支持。

2023-12-08 15:26:45

554

基于OpenVINO和LangChain構(gòu)建RAG問答系統(tǒng)

隨著生成式 AI 的興起，和大語言模型對話聊天的應(yīng)用變得非常熱門，但這類應(yīng)用往往只能簡單地和你“聊聊家?！?，并不能針對某些特定的行業(yè)，給出非常專業(yè)和精準的答案。這也是由于大語言模型（以下簡稱 LLM

2023-12-25 11:10:42

505

使用基于Transformers的API在CPU上實現(xiàn)LLM高效推理

英特爾 Extension for Transformers是英特爾推出的一個創(chuàng)新工具包，可基于英特爾架構(gòu)平臺，尤其是第四代英特爾至強可擴展處理器（代號 SapphireRapids，SPR）顯著加速基于Transformers的大語言模型( LargeLanguageModel,LLM)。

2024-01-22 11:11:06

1823

LLM3225

LLM3225 - Wire Wound Chip Inductors - TOKO, Inc

2022-11-04 17:22:44

LLM3225-R15H

LLM3225-R15H - Wire Wound Chip Inductors - TOKO, Inc

2022-11-04 17:22:44

LLM3225-R18H

LLM3225-R18H - Wire Wound Chip Inductors - TOKO, Inc

2022-11-04 17:22:44

LLM3225-R33H

LLM3225-R33H - Wire Wound Chip Inductors - TOKO, Inc

2022-11-04 17:22:44

LLM3225-R56H

LLM3225-R56H - Wire Wound Chip Inductors - TOKO, Inc

2022-11-04 17:22:44

LLM3225-R68H

LLM3225-R68H - Wire Wound Chip Inductors - TOKO, Inc

2022-11-04 17:22:44

探索者STM32F407

探索者STM32F407 DEVB_121X160MM 6~24V

2023-03-28 13:06:24

ArkUI開發(fā)趣味體驗，快來抽取限量HarmonyOS專屬頭像！

本次ArkUI開發(fā)趣味體驗活動，將手把手教大家如何在IDE里實操一個ArkUI程序，通過補充缺失代碼，成功運行程序開啟抽獎功能，抽取個人專屬頭像，做HarmonyOS第一批數(shù)字藏品家！同時本期提供

2022-12-08 17:20:47

DIY一款自己專屬的手柄

玩游戲的小伙伴都知道，有的游戲需要使用游戲手柄體驗才會更好，今天就我們來DIY一款自己專屬的手柄！1.設(shè)計思路電腦游戲手柄和鼠標鍵盤一樣屬于USBHID設(shè)備，Window系統(tǒng)和Linux系統(tǒng)和各種

2021-07-21 09:32:48

HarmonyOS 探索之路——電子書上線啦！

的你還不知道如何上手嗎？快來看看這本電子書下載地址：http://t.elecfans.com/ebook/118.html目錄HarmonyOS 探索之路（1）：開箱體驗HarmonyOS 探索之路

2021-01-28 15:03:07

HarmonyOS初步探索系列文章匯總

文章！鴻蒙初步探索系列：HarmonyOS初步探索01：下載安裝DevEco StudioHarmonyOS初步探索02：開發(fā)第一個HarmonyOS應(yīng)用HarmonyOS初步探索03：DevEco

2020-12-15 14:56:20

IEC61850協(xié)議通信的“基石”是什么？

這里給大家介紹一下IEC61850協(xié)議通信的“基石”— ASN.1編碼。

2021-05-14 07:15:20

OPPO在5G標準、研發(fā)和應(yīng)用探索方面有哪些布局？

11月15日，在重慶召開的《2018第二屆國際手機產(chǎn)業(yè)領(lǐng)袖峰會——5G新世界·AI云生態(tài)》論壇上，OPPO全球副總裁劉暢表示，5G可以催生出更多前所未有的應(yīng)用場景，OPPO正積極構(gòu)建自身的5G技術(shù)能力，并在標準、研發(fā)和應(yīng)用探索全方面的布局。OPPO全球副總裁劉暢

2019-09-11 11:51:52

【下載】《構(gòu)建嵌入式LINUX系統(tǒng)（第二版）》

Linux內(nèi)核的*新版本做過*新，并且加入之前未介紹過的程序以便協(xié)助你： ·建立你自己的GNU development toolchain(開發(fā)工具鏈) ·為你的目標系統(tǒng)選用、設(shè)定、構(gòu)建以及安裝專屬的內(nèi)核

2018-04-10 18:00:43

便攜設(shè)備電源管理設(shè)計技巧與難點探索

和通信電源的應(yīng)用工程師于相旭，帶我們走進電源管理技術(shù)的核心，一起探索便攜電源管理技術(shù)現(xiàn)在，未來。欲了解便攜設(shè)備電源管理技術(shù)，請點擊本期話題討論話題討論：構(gòu)建低功耗不可或缺的電源管理技術(shù)嘉賓：Intersil 工業(yè)電源和通信電源的應(yīng)用工程師于相旭{:4_99:}

2014-10-14 16:08:22

利用卷積調(diào)制構(gòu)建一種新的ConvNet架構(gòu)Conv2Former

1、利用卷積探索一種更高效的編碼空域特征的方式　　本文旨在通過充分利用卷積探索一種更高效的編碼空域特征的方式：通過組合ConvNet與ViT的設(shè)計理念，本文利用卷積調(diào)制操作對自注意力進行了簡化，進而

2022-12-19 17:37:34

如何使用Arm Compiler 5工具鏈構(gòu)建一個簡單的C程序

使用Arm編譯器構(gòu)建hello世界教程向您展示了如何使用Arm Compiler 5工具鏈構(gòu)建一個簡單的C程序。本教程超越了基礎(chǔ)知識，探索Arm編譯器5工具鏈的一些更高級的功能。本教程假設(shè)您已經(jīng)

2023-08-02 06:57:53

如何量身定做自己的專屬Beacon？

2021-05-20 06:39:17

打造專屬電源方案

錯開の折騰經(jīng)歷：ESP8266 NodeMCU文章目錄前言一、準備1.材料清單2.設(shè)計思路二、焊接三、總結(jié)前言繼續(xù)之前的項目，現(xiàn)在任務(wù)就是將實現(xiàn)的空調(diào)控制器集成于一塊pcb板子上，并打造專屬電源方案

2021-11-11 06:39:48

數(shù)據(jù)探索與數(shù)據(jù)預(yù)處理

目錄1數(shù)據(jù)探索與數(shù)據(jù)預(yù)處理21.1 賽題回顧21.2 數(shù)據(jù)探索性分析與異常值處理21.3 相關(guān)性分析52特征工程82.1 光伏發(fā)電領(lǐng)域特征82.2 高階環(huán)境特征112.3 特征選擇113模型構(gòu)建

2021-07-12 08:37:20

機器學習基石筆記

3）機器學習基石筆記 Lecture3：Types of Learning

2020-05-26 14:53:14

機器學習基石筆記分享

機器學習基石筆記01

2020-06-03 08:14:10

林軒田機器學習基石課程個人筆記

林軒田機器學習基石課程個人筆記-第二講

2020-05-22 07:35:12

正點原子STM32系列——探索者V3開發(fā)板評測報告聚合帖

】+I2C驅(qū)動OLED jinglixix 【正點原子STM32探索者V3開發(fā)板體驗】初識STM32F407開發(fā)板【正點原子STM32探索者V3開發(fā)板體驗】開發(fā)環(huán)境的構(gòu)建與GPIO口的使用【正點

2023-05-10 15:52:16

物聯(lián)網(wǎng)的基石-MQTT協(xié)議初識

1、物聯(lián)網(wǎng)的基石-mqtt協(xié)議初識隨著 5G 時代的來臨，萬物互聯(lián)的偉大構(gòu)想正在成為現(xiàn)實。聯(lián)網(wǎng)的物聯(lián)網(wǎng)設(shè)備在 2018 年已經(jīng)達到了 70 億，在未來兩年，僅智能水電氣表就將超過10億。海量

2022-09-08 16:03:12

精通信號處理設(shè)計小Tips（3）：必須掌握的三大基石

，以及對應(yīng)的硬件設(shè)計實現(xiàn)能力；具備通信物理層開發(fā)設(shè)計各個方面的實戰(zhàn)經(jīng) 驗...　　精通信號處理設(shè)計小Tips（3）：必須掌握的三大基石　　信號與信息處理涵蓋的內(nèi)容相當廣泛，并和自動控制，計算機等其他

2013-12-09 22:25:24

選擇藍牙開發(fā)板啟動你的專屬Beacon！

2021-05-21 06:45:22

彩虹AA電池賓得彩色單反專屬

彩虹AA電池賓得彩色單反專屬 2009年11月16日17:59:24

2009-11-16 17:59:34

762

專屬iPhone的兩款時尚充電器

著名的蘋果配件生產(chǎn)商Bracketron公布了最新專屬iPhone 4和IPhone 4S打造的MetalDock充電設(shè)備。

2012-05-09 09:05:36

405

e絡(luò)盟推出專屬網(wǎng)站平臺，幫助用戶構(gòu)建并推廣面向TI MCU LaunchPad的全新BoosterPack擴展板

2013年10月21日，e絡(luò)盟日前宣布推出全新專屬網(wǎng)站平臺‘構(gòu)建你的BoosterPack’，為設(shè)計師創(chuàng)造自己獨有的BoosterPack提供資源支持。BoosterPack是一款針對TI微控制器

2013-10-22 12:00:58

869

這么萌還不買？紅米Note4X初音專屬配色圖賞

紅米Note 4X 多彩金屬，超長續(xù)航，這是我們對國民手機的全新定義。這一次也特地邀請到初音未來，帶來她的專屬配色款。極具特色的初音未來專屬配色，不僅使手機有了一個獨特的外觀，還代表著對未來的無限期待。

2017-03-28 14:34:20

2997

構(gòu)建專屬于你的CAN-bus應(yīng)用層協(xié)議

隨著CAN-bus相關(guān)芯片價格的下降，內(nèi)置CAN控制器MCU的增多，CAN-bus當前已經(jīng)進入了眾多早期由于成本問題無法使用的領(lǐng)域，成為極具生命力的現(xiàn)場總線，今天我們就來探討如何構(gòu)建專屬自己的CAN-bus應(yīng)用層協(xié)議。

2017-05-02 15:31:37

如何構(gòu)建專屬自己的CAN-bus應(yīng)用層協(xié)議

2017-05-04 15:39:05

954

存儲 IC——現(xiàn)代信息技術(shù)的基石

存儲器可以說是大數(shù)據(jù)時代的基石。

2019-06-06 11:23:32

7592

5G手機需專屬應(yīng)用場景

本文主要講述了：若無專屬應(yīng)用場景，5G手機或成為無米之炊

2019-08-15 10:50:37

5639

如何定義一個Blocklet基石程序

Blocklet（基石程序）是供開發(fā)者和社區(qū)用戶在ArcBlock平臺上創(chuàng)建事物的可重用構(gòu)建模塊。簡單來說，Blocklet 可以是任何現(xiàn)成的組件、模塊、庫、前端視圖或其他簡化構(gòu)建 dApp（去中心化應(yīng)用）過程的工具。

2019-09-30 10:26:43

273

特斯拉Roadster車主的專屬服務(wù)

日前據(jù)外媒報道，特斯拉向Roadster車主發(fā)送了郵件，聲稱將為車主提供包括專屬的服務(wù)顧問在內(nèi)的“專屬渠道”，以改善多年來特斯拉對Roadster車主的服務(wù)。并邀請Roadster車主用他們的舊車抵價購買新款特斯拉電動汽車，或者用于購買最新的Roadster跑車。

2019-12-05 16:35:51

2249

屬于使用Keil朋友的專屬文章

一篇屬于使用Keil朋友的專屬文章

2020-03-14 14:38:55

1326

英特爾構(gòu)建智慧云基石，推動企業(yè)在數(shù)字經(jīng)濟時代前進

“后新冠時代”，在線（云）上，人與人的交流變得更加容易。4月底，“英特爾構(gòu)建智慧云基石”線上沙龍如約舉行，英特爾及合作伙伴的專家們，圍繞著“快捷上云、高效用云、輕松管云”三個核心點，又延展

2020-05-09 14:46:16

3205

高通安蒙：構(gòu)建無線技術(shù)的未來，探索5G未來之路

“What’s Next in 5G”系列視頻迎來了最后一集，將由高通公司總裁兼候任CEO安蒙為大家解析高通將如何構(gòu)建無線技術(shù)的未來，探索5G未來之路。以下為安蒙演講全文： 5G未來

2021-03-02 11:29:57

1512

浪潮存儲助力九寨溝構(gòu)建智慧產(chǎn)業(yè)升級的數(shù)據(jù)基石

為游客營造信息對稱、安全、舒適、有序、交通順暢的旅游環(huán)境，九寨溝借助數(shù)字科技技術(shù)構(gòu)建了智慧旅游大數(shù)據(jù)綜合管理平臺，在堅持以景區(qū)生態(tài)環(huán)境承載量為第一前提的“保護型發(fā)展”原則，打造兼顧人與自然

2021-12-30 11:31:22

999

汽車網(wǎng)絡(luò)安全左移實踐——基于信任構(gòu)建汽車安全的探索

汽車網(wǎng)絡(luò)安全左移實踐——基于信任構(gòu)建汽車安全的探索

2023-02-06 15:06:56

611

LangChain：為你定制一個專屬的GPT

LangChain 可以輕松管理與語言模型的交互，將多個組件鏈接在一起，并集成額外的資源，例如 API 和數(shù)據(jù)庫。其組件包括了模型（各類LLM），提示模板（Prompts），索引，代理（Agent），記憶等等。

2023-04-24 11:27:23

980

如何利用LLM做多模態(tài)任務(wù)？

大型語言模型LLM（Large Language Model）具有很強的通用知識理解以及較強的邏輯推理能力，但其只能處理文本數(shù)據(jù)。雖然已經(jīng)發(fā)布的GPT4具備圖片理解能力，但目前還未開放多模態(tài)輸入接口并且不會透露任何模型上技術(shù)細節(jié)。因此，現(xiàn)階段，如何利用LLM做一些多模態(tài)任務(wù)還是有一定的研究價值的。

2023-05-11 17:09:16

648

如何利用LLM做一些多模態(tài)任務(wù)

本文整理了近兩年來基于LLM做vision-lanuage任務(wù)的一些工作，并將其劃分為4個類別：

2023-05-17 15:02:35

575

LangChain簡介

對 ChatGPT 等應(yīng)用著迷？想試驗他們背后的模型嗎？甚至開源/免費模型？不要再觀望……LangChain 是必經(jīng)之路……

2023-05-22 09:14:56

7793

邱錫鵬團隊提出具有內(nèi)生跨模態(tài)能力的SpeechGPT，為多模態(tài)LLM指明方向

大型語言模型（LLM）在各種自然語言處理任務(wù)上表現(xiàn)出驚人的能力。與此同時，多模態(tài)大型語言模型，如 GPT-4、PALM-E 和 LLaVA，已經(jīng)探索了 LLM 理解多模態(tài)信息的能力。然而，當前

2023-05-22 14:38:06

417

LLM性能的主要因素

現(xiàn)在是2023年5月，截止目前，網(wǎng)絡(luò)上已經(jīng)開源了眾多的LLM，如何用較低的成本，判斷LLM的基礎(chǔ)性能，選到適合自己任務(wù)的LLM，成為一個關(guān)鍵。本文會涉及以下幾個問題：影響LLM性能的主要因素

2023-05-22 15:26:20

1148

如何利用LLM做多模態(tài)任務(wù)？

大型語言模型LLM（Large Language Model）具有很強的通用知識理解以及較強的邏輯推理能力，但其只能處理文本數(shù)據(jù)。雖然已經(jīng)發(fā)布的GPT4具備圖片理解能力，但目前還未開放多模態(tài)輸入接口

2023-05-22 15:57:33

466

如何最好地使用所有可用的 LLM 工具

鑒于價格和質(zhì)量的廣泛差異，從業(yè)者可能很難決定如何最好地使用所有可用的 LLM 工具。此外，如果服務(wù)中斷，則依賴單個 API 提供者是不可靠的，這可能發(fā)生在意外高需求的情況下。

2023-05-23 17:22:30

525

LLM在各種情感分析任務(wù)中的表現(xiàn)如何

? 最近幾年，GPT-3、PaLM和GPT-4等LLM刷爆了各種NLP任務(wù)，特別是在zero-shot和few-shot方面表現(xiàn)出它們強大的性能。因此，情感分析(SA)領(lǐng)域也必然少不了LLM的影子

2023-05-29 17:24:41

1379

微軟將向美國政府客戶提供OpenAI的GPT模型

微軟增加了對大型語言模型（llm）的支持。openai推出chatgpt后，llm的使用大幅增加，微軟持有openai的股份，許多類型的公司爭相在llm上構(gòu)建功能。

2023-06-08 10:35:43

759

大型語言模型（LLM）的自定義訓(xùn)練：包含代碼示例的詳細指南

近年來，像 GPT-4 這樣的大型語言模型（LLM）因其在自然語言理解和生成方面的驚人能力而受到廣泛關(guān)注。但是，要根據(jù)特定任務(wù)或領(lǐng)域定制LLM，定制培訓(xùn)是必要的。本文提供了有關(guān)自定義訓(xùn)練 LLM 的詳細分步指南，其中包含代碼示例和示例。

2023-06-12 09:35:43

1783

Macaw-LLM：具有圖像、音頻、視頻和文本集成的多模態(tài)語言建模

盡管指令調(diào)整的大型語言模型 (LLM) 在各種 NLP 任務(wù)中表現(xiàn)出卓越的能力，但它們在文本以外的其他數(shù)據(jù)模式上的有效性尚未得到充分研究。在這項工作中，我們提出了 Macaw-LLM，一種新穎的多模式 LLM，它無縫集成了視覺、音頻和文本信息。

2023-06-19 10:35:33

876

基于Transformer的大型語言模型（LLM）的內(nèi)部機制

本文旨在更好地理解基于 Transformer 的大型語言模型（LLM）的內(nèi)部機制，以提高它們的可靠性和可解釋性。隨著大型語言模型（LLM）在使用和部署方面的不斷增加，打開黑箱并了解它們的內(nèi)部

2023-06-25 15:08:49

991

基于一個完整的 LLM 訓(xùn)練流程

? ? 在這篇文章中，我們將盡可能詳細地梳理一個完整的 LLM 訓(xùn)練流程。包括模型預(yù)訓(xùn)練（Pretrain）、Tokenizer 訓(xùn)練、指令微調(diào)（Instruction Tuning）等環(huán)節(jié)。文末

2023-06-29 10:08:59

1202

把LangChain跑起來的3個方法

使用 LangChain 開發(fā) LLM 應(yīng)用時，需要機器進行 GLM 部署，好多同學第一步就被勸退了，

2023-07-05 09:59:06

797

最新綜述！當大型語言模型（LLM）遇上知識圖譜：兩大技術(shù)優(yōu)勢互補

LLM 是黑箱模型，缺乏可解釋性，因此備受批評。LLM 通過參數(shù)隱含地表示知識。因此，我們難以解釋和驗證 LLM 獲得的知識。此外，LLM 是通過概率模型執(zhí)行推理，而這是一個非決斷性的過程。對于 LLM 用以得出預(yù)測結(jié)果和決策的具體模式和功能，人類難以直接獲得詳情和解釋。

2023-07-10 11:35:00

1354

什么是LangChain？深入地了解一下LangChain

在日常生活中，我們通常致力于構(gòu)建端到端的應(yīng)用程序。有許多自動機器學習平臺和持續(xù)集成/持續(xù)交付（CI/CD）流水線可用于自動化我們的機器學習流程。我們還有像 Roboflow 和 Andrew N.G. 的 Landing AI 這樣的工具，可以自動化或創(chuàng)建端到端的計算機視覺應(yīng)用程序。

2023-07-14 09:50:57

15274

適用于各種NLP任務(wù)的開源LLM的finetune教程~

ChatGLM2-6b是清華開源的小尺寸LLM，只需要一塊普通的顯卡(32G較穩(wěn)妥)即可推理和微調(diào)，是目前社區(qū)非常活躍的一個開源LLM。

2023-07-24 09:04:22

1311

LLM對程序員的沖擊和影響

LLM 對軟件研發(fā)的單點提效，我之前錄制過一段視頻，大家可以直接觀看，里面有詳細的演示，我在這里就不再贅述了。

2023-07-24 15:39:06

766

LLM的長度外推淺談

蘇神最早提出的擴展LLM的context方法，基于bayes啟發(fā)得到的公式

2023-07-28 17:37:43

1484

MLC-LLM的編譯部署流程

MLC-LLM部署在各種硬件平臺的需求，然后我就開始了解MLC-LLM的編譯部署流程和RWKV World模型相比于MLC-LLM已經(jīng)支持的Raven系列模型的特殊之處。 MLC-LLM的編譯部署流程

2023-09-04 09:22:46

1569

檢索增強LLM的方案全面的介紹

分分享了 ChatGPT 這類模型是如何一步一步訓(xùn)練的，后半部分主要分享了 LLM 模型的一些應(yīng)用方向，其中就對檢索增強 LLM 這個應(yīng)用方向做了簡單介紹。

2023-09-08 16:39:55

799

mlc-llm對大模型推理的流程及優(yōu)化方案

在 MLC-LLM 部署RWKV World系列模型實戰(zhàn)（3B模型Mac M2解碼可達26tokens/s）中提到要使用mlc-llm部署模型首先需要一個編譯過程，將原始的基于Realx搭建的模型

2023-09-26 12:25:55

383

新型威脅：探索LLM攻擊對網(wǎng)絡(luò)安全的沖擊

最令人擔憂的也許是，目前尚不清楚 LLM 提供商是否能夠完全修復(fù)此類行為。在過去的 10 年里，在計算機視覺領(lǐng)域，類似的對抗性攻擊已經(jīng)被證明是一個非常棘手的問題。有可能深度學習模型根本就無法避免這種威脅。因此，我們認為，在增加對此類人工智能模型的使用和依賴時，應(yīng)該考慮到這些因素。

2023-10-11 16:28:37

482

Continuous Batching：解鎖LLM潛力！讓LLM推斷速度飆升23倍，降低延遲！

本文介紹一篇 LLM 推理加速技術(shù) 相關(guān)的文章，值得讀一讀。 LLMs 在現(xiàn)實應(yīng)用中的計算成本主要由服務(wù)成本所主導(dǎo)，但是傳統(tǒng)的批處理策略存在低效性。在這篇文章中，我們將告訴

2023-10-15 20:25:02

292

在線研討會 | 基于 Jetson 邊緣計算平臺構(gòu)建 Azure OpenAI LLM 安全護欄

，并通過自定義方式響應(yīng)用戶特定的請求，按照預(yù)定義的對話路徑進行操作，以及使用特定的語言風格進行回答等。它的核心價值在于通過 Colang 語言來編寫安全護欄，來指導(dǎo)、定義和控制 LLM 驅(qū)動的對話機器人在特定主題上的行為，從而構(gòu)建可靠、安全的 LLM 對話系統(tǒng)。如何在

2023-10-21 16:35:03

215

Hugging Face LLM部署大語言模型到亞馬遜云科技Amazon SageMaker推理示例

?本篇文章主要介紹如何使用新的Hugging Face LLM推理容器將開源LLMs，比如BLOOM大型語言模型部署到亞馬遜云科技Amazon SageMaker進行推理的示例。我們將部署12B

2023-11-01 17:48:42

422

LLM的Transformer是否可以直接處理視覺Token？

多種LLM Transformer都可以提升Visual Encoding。例如用LLaMA和OPT的不同Transformer層都會有提升，而且不同層之間也會體現(xiàn)不同的規(guī)律。

2023-11-03 14:10:15

181

NVIDIA AI Foundation Models：使用生產(chǎn)就緒型 LLM 構(gòu)建自定義企業(yè)聊天機器人和智能副駕

? 系列基礎(chǔ)模型是一套功能強大的全新工具，可用于為企業(yè)構(gòu)建生產(chǎn)就緒生成式 AI 應(yīng)用，從而推動從客服 AI 聊天機器人到尖端 AI 產(chǎn)品的各種創(chuàng)新。這些新的基礎(chǔ)模型現(xiàn)已加入? NVIDIA NeMo 。這個端到端框架用于構(gòu)建、自定義和部署專為企業(yè)定制的 LLM。企業(yè)現(xiàn)在可以使用這些工具快速

2023-11-17 21:35:01

469

LLM的幻覺問題最新綜述

幻覺被描述為無意義或不忠實于所提供源內(nèi)容的生成內(nèi)容。根據(jù)與源內(nèi)容的矛盾，這些幻覺又進一步分為內(nèi)在幻覺和外在幻覺。在LLMs中，幻覺的范圍包含了一個更廣泛、更全面的概念，主要集中在事實錯誤上。本文重新定義了幻覺的分類，為LLM應(yīng)用程序提供了一個更定制的框架。

2023-11-22 17:40:41

467

基于單一LLM的情感分析方法的局限性

LLM的發(fā)展為情感分析任務(wù)帶來的新的解決方案。有研究人員使用LLM，在上下文學習(in-context learning, ICL)的范式下，僅使用少量的訓(xùn)練示例就能夠?qū)崿F(xiàn)與監(jiān)督學習策略旗鼓相當?shù)男阅鼙憩F(xiàn)。

2023-11-23 11:14:27

322

基于Redis Enterprise，LangChain，OpenAI 構(gòu)建一個電子商務(wù)聊天機器人

鑒于最近人工智能支持的API和網(wǎng)絡(luò)開發(fā)工具的激增，許多科技公司都在將聊天機器人集成到他們的應(yīng)用程序中。LangChain是一種備受歡迎的新框架，近期引起了廣泛關(guān)注。該框架旨在簡化開發(fā)人員與語言模型

2023-11-25 08:04:13

178

專欄發(fā)布 | LLM圈走馬換將？微軟廣告“黑五”來襲！

過去一年并不平凡。從去年11月至今，LLM大型語言模型持續(xù)破圈、始終盤踞熱點話題之列。根據(jù)Adobe Analytics的最新在線購物預(yù)測，感恩節(jié)本土市場假日季的在線收入，或?qū)⒂?/div>

2023-11-27 08:15:02

215

Long-Context下LLM模型架構(gòu)全面介紹

隨著ChatGPT的快速發(fā)展，基于Transformer的大型語言模型(LLM)為人工通用智能(AGI)鋪平了一條革命性的道路，并已應(yīng)用于知識庫、人機界面和動態(tài)代理等不同領(lǐng)域。然而，存在一個普遍

2023-11-27 17:37:36

440

Ambarella展示了在其CV3-AD芯片上運行LLM的能力

Ambarella前不久展示了在其CV3-AD芯片上運行LLM的能力。這款芯片是CV3系列中最強大的，專為自動駕駛設(shè)計。

2023-11-28 09:05:31

1192

怎樣使用Accelerate庫在多GPU上進行LLM推理呢？

大型語言模型(llm)已經(jīng)徹底改變了自然語言處理領(lǐng)域。隨著這些模型在規(guī)模和復(fù)雜性上的增長，推理的計算需求也顯著增加。

2023-12-01 10:24:52

396

如何利用OpenVINO加速LangChain中LLM任務(wù)

LangChain 是一個高層級的開源的框架，從字面意義理解，LangChain 可以被用來構(gòu)建 “語言處理任務(wù)的鏈條”，它可以讓AI開發(fā)人員把大型語言模型（LLM）的能力和外部數(shù)據(jù)結(jié)合起來，從而

2023-12-05 09:58:14

325

全面解析大語言模型（LLM）

internal feedback：使用LLM去預(yù)測生成的plan取得成功的概率、Tree of Thought去對比不同的plan（有點類似AlphaGo的蒙特卡諾搜索的意思）、對中間結(jié)果進行評估并作為長期記憶存儲

2023-12-05 14:49:47

857

一文詳解LLM模型基本架構(gòu)

LLM 中非常重要的一個概念是 Token，我們輸入給 LLM 和它輸出的都是 Token。Token 在這里可以看做語言的基本單位，中文一般是詞或字（其實字也是詞）。比如：”我們喜歡 Rust

2023-12-25 10:38:38

657

優(yōu)于10倍參數(shù)模型！微軟發(fā)布Orca 2 LLM

微軟發(fā)布 Orca 2 LLM，這是 Llama 2 的一個調(diào)優(yōu)版本，性能與包含 10 倍參數(shù)的模型相當，甚至更好。

2023-12-26 14:23:16

247

LangChain 0.1版本正式發(fā)布

LangChain 由 Harrison Chase 于 2022 年 10 月推出，是一個開源編排框架，用于使用 LLM 開發(fā)應(yīng)用程序，推出后迅速脫穎而出，截至 2023 年 6 月，它是 GitHub 上增長最快的開源項目。

2024-01-10 10:28:28

391

用Redis為LangChain定制AI代理——OpenGPTs

OpenAI最近推出了OpenAIGPTs——一個構(gòu)建定制化AI代理的無代碼“應(yīng)用商店”，隨后LangChain開發(fā)了類似的開源工具OpenGPTs。OpenGPTs是一款低代碼的開源框架，專用

2024-01-13 08:03:59

521

虹科分享 | 用Redis為LangChain定制AI代理——OpenGPTs

OpenAI最近推出了OpenAI GPTs——一個構(gòu)建定制化AI代理的無代碼“應(yīng)用商店”，隨后LangChain開發(fā)了類似的開源工具OpenGPTs。OpenGPTs是一款低代碼的開源框架，專用于構(gòu)建定制化的人工智能代理。

2024-01-18 10:39:08

121

2023年LLM大模型研究進展

作為做LLM應(yīng)用的副產(chǎn)品，我們提出了RLCD[11]，通過同時使用正例和負例prompt，自動生成帶標簽的生成樣本不需人工標注，然后可以接大模型微調(diào)，或者用于訓(xùn)練reward models

2024-01-19 13:55:33

178

LLM推理加速新范式！推測解碼（Speculative Decoding）最新綜述

這個問題隨著LLM規(guī)模的增大愈發(fā)嚴重。并且，如下左圖所示，目前LLM常用的自回歸解碼（autoregressive decoding）在每個解碼步只能生成一個token。這導(dǎo)致GPU計算資源利用率

2024-01-29 15:54:24

261

100%在樹莓派上執(zhí)行的LLM項目

ChatGPT的人性口語化回復(fù)相信許多人已體驗過，也因此掀起一波大型語言模型（Large Language Model, LLM）熱潮，LLM即ChatGPT背后的主運作技術(shù)，但LLM運作需要龐大運算力，因此目前多是在云端（Cloud）上執(zhí)行。

2024-02-29 16:29:59

476

基于NVIDIA Megatron Core的MOE LLM實現(xiàn)和訓(xùn)練優(yōu)化

本文將分享阿里云人工智能平臺 PAI 團隊與 NVIDIA Megatron-Core 團隊在 MoE (Mixture of Experts) 大語言模型（LLM）實現(xiàn)與訓(xùn)練優(yōu)化上的創(chuàng)新工作。

2024-03-22 09:50:37

已全部加載完成

搜索歷史

探索LangChain：構(gòu)建專屬LLM應(yīng)用的基石

評論