資料介紹
Web 文本挖掘是Web 數(shù)據(jù)挖掘的一個(gè)重要研究領(lǐng)域。文本挖掘的主要方法是文本分類
和聚類。本文主要討論了在文本挖掘中文本的表示,以及文本聚類的算法描述。
關(guān)鍵詞:Web 文本挖掘,分類,聚類
隨著 Internet 的迅速發(fā)展及Web 的全球普及,使得Web 上的信息量無(wú)比豐富,通過(guò)對(duì)Web
的挖掘,可以對(duì)Web 上的大量數(shù)據(jù)進(jìn)行分析和處理,以便識(shí)別、分析、獲取、存儲(chǔ)有用信息,并將其轉(zhuǎn)化為知識(shí)。Web 挖掘依靠它所挖掘的站點(diǎn)信息來(lái)源可以分為三類:Web 內(nèi)容挖掘、Web 結(jié)構(gòu)挖掘和Web 使用挖掘。
Web 內(nèi)容挖掘研究的對(duì)象是網(wǎng)頁(yè)本身的內(nèi)容以及Web 搜索的結(jié)果。Web 的頁(yè)面信息主
要包括文本信息和多媒體信息,所以挖掘主要包括對(duì)頁(yè)面文本信息的挖掘和多媒體挖掘,其中以Web 文本內(nèi)容挖掘?yàn)橹鳌6W(wǎng)頁(yè)中最主要的信息資源是文本,因此Web 文本挖掘又成為Web 數(shù)據(jù)挖掘的一個(gè)重要研究領(lǐng)域。
和聚類。本文主要討論了在文本挖掘中文本的表示,以及文本聚類的算法描述。
關(guān)鍵詞:Web 文本挖掘,分類,聚類
隨著 Internet 的迅速發(fā)展及Web 的全球普及,使得Web 上的信息量無(wú)比豐富,通過(guò)對(duì)Web
的挖掘,可以對(duì)Web 上的大量數(shù)據(jù)進(jìn)行分析和處理,以便識(shí)別、分析、獲取、存儲(chǔ)有用信息,并將其轉(zhuǎn)化為知識(shí)。Web 挖掘依靠它所挖掘的站點(diǎn)信息來(lái)源可以分為三類:Web 內(nèi)容挖掘、Web 結(jié)構(gòu)挖掘和Web 使用挖掘。
Web 內(nèi)容挖掘研究的對(duì)象是網(wǎng)頁(yè)本身的內(nèi)容以及Web 搜索的結(jié)果。Web 的頁(yè)面信息主
要包括文本信息和多媒體信息,所以挖掘主要包括對(duì)頁(yè)面文本信息的挖掘和多媒體挖掘,其中以Web 文本內(nèi)容挖掘?yàn)橹鳌6W(wǎng)頁(yè)中最主要的信息資源是文本,因此Web 文本挖掘又成為Web 數(shù)據(jù)挖掘的一個(gè)重要研究領(lǐng)域。
下載該資料的人也在下載
下載該資料的人還在閱讀
更多 >
- 基于注意力機(jī)制的新聞文本分類模型 30次下載
- 基于LSTM的表示學(xué)習(xí)-文本分類模型 18次下載
- 基于主題分布優(yōu)化的模糊文本分類方法 5次下載
- 基于不同神經(jīng)網(wǎng)絡(luò)的文本分類方法研究對(duì)比 48次下載
- 融合文本分類和摘要的多任務(wù)學(xué)習(xí)摘要模型 11次下載
- 一種基于BERT模型的社交電商文本分類算法 8次下載
- 基于BP神經(jīng)網(wǎng)絡(luò)分類器的垃圾文本過(guò)濾模型 43次下載
- 結(jié)合BERT模型的中文文本分類算法 6次下載
- 基于深度神經(jīng)網(wǎng)絡(luò)的文本分類分析 37次下載
- 如何使用Spark計(jì)算框架進(jìn)行分布式文本分類方法的研究 3次下載
- 基于標(biāo)題的文本自動(dòng)分類研究 0次下載
- 基于Rough集的web文本分類研究
- 用于文本分類和文本聚類的特征抽取方法的研究
- 一種適應(yīng)短文本的相關(guān)測(cè)度及其應(yīng)用
- 基于危險(xiǎn)理論的web文本挖掘研究
- 卷積神經(jīng)網(wǎng)絡(luò)在文本分類領(lǐng)域的應(yīng)用 358次閱讀
- 交換機(jī)的分類及其特點(diǎn) 852次閱讀
- 繼電器的分類及其特點(diǎn) 1797次閱讀
- 人工智能中文本分類的基本原理和關(guān)鍵技術(shù) 947次閱讀
- 常用傳感器分類及其應(yīng)用 3140次閱讀
- 面向結(jié)構(gòu)化數(shù)據(jù)的文本生成技術(shù)研究 481次閱讀
- Linux系統(tǒng)中的10個(gè)常用的文本查看命令 1w次閱讀
- 基于文本到圖像模型的可控文本到視頻生成 801次閱讀
- Web的應(yīng)用基礎(chǔ) 645次閱讀
- 文本分類中處理樣本不均衡和提升模型魯棒性的trick 905次閱讀
- 帶你從頭構(gòu)建文本分類器 3288次閱讀
- 電氣工作原理圖及其符號(hào)所表示的含義 2.5w次閱讀
- 如何為文本分類任務(wù)選擇正確的模型,這里有一個(gè)完整流程圖! 1.2w次閱讀
- 詳細(xì)解析scikit-learn進(jìn)行文本分類 4626次閱讀
- LED數(shù)碼管顯示分類及其典型應(yīng)用電路 1.1w次閱讀
下載排行
本周
- 1HFSS電磁仿真設(shè)計(jì)應(yīng)用詳解PDF電子教程免費(fèi)下載
- 24.30 MB | 126次下載 | 1 積分
- 2H橋中的電流感測(cè)
- 545.39KB | 7次下載 | 免費(fèi)
- 3雷達(dá)的基本分類方法
- 1.25 MB | 4次下載 | 4 積分
- 4I3C–下一代串行通信接口
- 608.47KB | 3次下載 | 免費(fèi)
- 5電感技術(shù)講解
- 827.73 KB | 2次下載 | 免費(fèi)
- 6從 MSP430? MCU 到 MSPM0 MCU 的遷移指南
- 1.17MB | 2次下載 | 免費(fèi)
- 7有源低通濾波器設(shè)計(jì)應(yīng)用說(shuō)明
- 1.12MB | 2次下載 | 免費(fèi)
- 8RA-Eco-RA2E1-48PIN-V1.0開發(fā)板資料
- 35.59 MB | 2次下載 | 免費(fèi)
本月
- 12024年工控與通信行業(yè)上游發(fā)展趨勢(shì)和熱點(diǎn)解讀
- 2.61 MB | 763次下載 | 免費(fèi)
- 2HFSS電磁仿真設(shè)計(jì)應(yīng)用詳解PDF電子教程免費(fèi)下載
- 24.30 MB | 126次下載 | 1 積分
- 3繼電保護(hù)原理
- 2.80 MB | 36次下載 | 免費(fèi)
- 4正激、反激、推挽、全橋、半橋區(qū)別和特點(diǎn)
- 0.91 MB | 32次下載 | 1 積分
- 5labview實(shí)現(xiàn)DBC在界面加載配置
- 0.57 MB | 21次下載 | 5 積分
- 6在設(shè)計(jì)中使用MOSFET瞬態(tài)熱阻抗曲線
- 1.57MB | 15次下載 | 免費(fèi)
- 7GBT 4706.1-2024家用和類似用途電器的安全第1部分:通用要求
- 7.43 MB | 13次下載 | 免費(fèi)
- 8PADS-3D庫(kù)文件
- 2.70 MB | 10次下載 | 2 積分
總榜
- 1matlab軟件下載入口
- 未知 | 935113次下載 | 10 積分
- 2開源硬件-PMP21529.1-4 開關(guān)降壓/升壓雙向直流/直流轉(zhuǎn)換器 PCB layout 設(shè)計(jì)
- 1.48MB | 420061次下載 | 10 積分
- 3Altium DXP2002下載入口
- 未知 | 233084次下載 | 10 積分
- 4電路仿真軟件multisim 10.0免費(fèi)下載
- 340992 | 191360次下載 | 10 積分
- 5十天學(xué)會(huì)AVR單片機(jī)與C語(yǔ)言視頻教程 下載
- 158M | 183329次下載 | 10 積分
- 6labview8.5下載
- 未知 | 81578次下載 | 10 積分
- 7Keil工具M(jìn)DK-Arm免費(fèi)下載
- 0.02 MB | 73804次下載 | 10 積分
- 8LabVIEW 8.6下載
- 未知 | 65985次下載 | 10 積分
評(píng)論
查看更多