男人放进女人阳道流出来的是什么,国产成人精品999视频

在IJCAI-2019期間舉辦的騰訊TAIC晚宴和Booth Talk中，來自TEG數(shù)據(jù)平臺的張長旺向大家介紹了自己所在用戶畫像組的前沿科研結(jié)果：

1. 非監(jiān)督短文本層級分類；

2. 大規(guī)模復(fù)雜網(wǎng)絡(luò)挖掘和圖表示學(xué)習(xí)。

其所在團(tuán)隊積極與學(xué)術(shù)界科研合作，并希望有夢想、愛學(xué)習(xí)的實力派加入，共同研究和應(yīng)用半監(jiān)督/弱監(jiān)督/無監(jiān)督學(xué)習(xí)、小樣本學(xué)習(xí)、大規(guī)模復(fù)雜網(wǎng)絡(luò)挖掘和圖表示學(xué)習(xí)等做大數(shù)據(jù)挖掘。

科研結(jié)果1：非監(jiān)督短文本層級分類

首先以下用戶和AI算法的對話，顯示了現(xiàn)實業(yè)務(wù)中使用現(xiàn)有監(jiān)督文本分類算法的遇到的一些困境和問題：

算法需要海量訓(xùn)練數(shù)據(jù)

算法模型用戶不可控

算法不能很好的適應(yīng)類目的變化

我們分析現(xiàn)有監(jiān)督算法的主要問題在于沒有真正的知識, 沒有對于文本和類目的真正的理解?，F(xiàn)有算法只是在學(xué)習(xí)大量人工標(biāo)注訓(xùn)練樣本里面的模式。為了解決這個問題，我們啟動了一個叫做: 基于關(guān)鍵詞知識與類目知識的非監(jiān)督短文本層級分類的探索項目。

項目的主要思想是引入關(guān)鍵詞和類目兩種知識來幫助算法理解關(guān)鍵詞和類目的含義。然后基于知識進(jìn)行文本的分類和標(biāo)注。關(guān)鍵詞知識主要來自3個方面包括：關(guān)鍵詞的網(wǎng)絡(luò)搜索上下文、關(guān)鍵詞的百科上下文、關(guān)鍵詞到類目詞的后驗關(guān)聯(lián)概率。我們提出類目語義表達(dá)式來支持用戶表達(dá)豐富的類目本身和類目之間的關(guān)系的語義。這兩樣知識的引入幫助算法擺脫了對于大量人工標(biāo)注訓(xùn)練樣本的依賴，同時算法分類的過程做到了人工可理解，人工可控制。

基于關(guān)鍵詞和類目知識的無監(jiān)督文本層級分類算法流程如下:

對文本提取關(guān)鍵詞

根據(jù)關(guān)鍵詞知識計算關(guān)鍵詞到類目詞的相關(guān)度詞向量

根據(jù)關(guān)鍵詞的相關(guān)度詞向量計算文本的相關(guān)度詞向量

根據(jù)文本的相關(guān)度詞向量和類目語義表達(dá)式計算文本與每個類目的匹配度

每個文本被分為與之匹配度最高的類目

通過在兩個文本分類數(shù)據(jù)集合上面的實驗，我們發(fā)現(xiàn)，我們自研的算法能夠在沒有訓(xùn)練樣本的情況下提供質(zhì)量可用的結(jié)果，其一級類目準(zhǔn)確率能夠達(dá)到80%，并且明顯高于現(xiàn)有其他非監(jiān)督算法。

科研結(jié)果2：大規(guī)模復(fù)雜網(wǎng)絡(luò)挖掘和圖表示學(xué)習(xí)

Network Representation Learning 或者說 Graph Embedding 是復(fù)雜網(wǎng)絡(luò)最新的研究課題，意在通過神經(jīng)網(wǎng)絡(luò)模型，把圖結(jié)構(gòu)向量化，為節(jié)點分類、鏈路預(yù)測、社團(tuán)發(fā)現(xiàn)等挖掘任務(wù)提供方便有效的特征，以克服圖結(jié)構(gòu)難以應(yīng)用到機器學(xué)習(xí)算法中的難題。

本次我們在IJCAI發(fā)表的學(xué)術(shù)論文“Identifying Illicit Accounts in Large Scale E-payment Networks - A Graph Representation Learning Approach”創(chuàng)新性提出結(jié)合邊屬性的圖卷積神經(jīng)網(wǎng)絡(luò)模型，彌補了現(xiàn)有算法無法利用邊屬性為節(jié)點分類提供更多信息的不足。

現(xiàn)有的圖學(xué)習(xí)算法，絕大部分都忽視了邊上信息的價值。在這里我們提出了一種可以把邊的信息傳輸?shù)焦?jié)點表示結(jié)果的改進(jìn)的GCN算法。算法主要思路是在做GCN里面周邊鄰居節(jié)點向量的聚合計算之前，把每個節(jié)點連接邊的Embedding向量拼接在對應(yīng)鄰居節(jié)點的Embedding向量后面。實驗顯示，我們的算法對于金融分類問題具有更優(yōu)的結(jié)果。我們團(tuán)隊正在進(jìn)一步優(yōu)化模型，正在研發(fā)利用時序的GCN模型，以可以利用邊的時序交互信息，從而更好的表示動態(tài)網(wǎng)絡(luò)。

同時，數(shù)平數(shù)據(jù)中心研發(fā)的Angel參數(shù)服務(wù)器平臺，針對關(guān)系型數(shù)據(jù)結(jié)構(gòu)，在計算性能上對圖算法做了優(yōu)化，極大加速了PageRank等算法的計算速度，比如計算用戶中心度的Closeness算法，性能比基于Spark GraphX的算法提升了6.7倍。下圖顯示對于大型圖的計算，我們Angle框架的速度具有明顯的優(yōu)勢。

我們所在團(tuán)隊積極與學(xué)術(shù)界科研合作，并希望有夢想、愛學(xué)習(xí)的實力派加入，共同研究和應(yīng)用半監(jiān)督/弱監(jiān)督/無監(jiān)督學(xué)習(xí)、小樣本學(xué)習(xí)、復(fù)雜網(wǎng)絡(luò)挖掘和圖表示學(xué)習(xí)做大數(shù)據(jù)挖掘。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

算法

算法

+關(guān)注

關(guān)注
23

文章
4681

瀏覽量
94320
大數(shù)據(jù)

大數(shù)據(jù)

+關(guān)注

關(guān)注
64

文章
8941

瀏覽量
139077

原文標(biāo)題：IJCAI2019報告：基于無監(jiān)督學(xué)習(xí)和圖學(xué)習(xí)的大數(shù)據(jù)挖掘

文章出處：【微信號：Tencent_TEG，微信公眾號：騰訊技術(shù)工程官方號】歡迎添加關(guān)注！文章轉(zhuǎn)載請注明出處。

什么是機器學(xué)習(xí)？通過機器學(xué)習(xí)方法能解決哪些問題？

計算機系統(tǒng)自身的性能”。事實上，由于“經(jīng)驗”在計算機系統(tǒng)中主要以數(shù)據(jù)的形式存在，因此機器學(xué)習(xí)需要設(shè)法對數(shù)據(jù)進(jìn)行分析學(xué)習(xí)，這就使得它逐漸成為智能數(shù)據(jù)

發(fā)表于 11-16 01:07 ?724次閱讀

時空引導(dǎo)下的時間序列自監(jiān)督學(xué)習(xí)框架

【導(dǎo)讀】最近，香港科技大學(xué)、上海AI Lab等多個組織聯(lián)合發(fā)布了一篇時間序列無監(jiān)督預(yù)訓(xùn)練的文章，相比原來的TS2Vec等時間序列表示學(xué)習(xí)工作，核心在于提出了將空間信息融入到預(yù)訓(xùn)練階段，即在預(yù)訓(xùn)練階段

發(fā)表于 11-15 11:41 ?569次閱讀

基于Kepware的Hadoop大數(shù)據(jù)應(yīng)用構(gòu)建-提升數(shù)據(jù)價值利用效能

處理超大數(shù)據(jù)集。 Hadoop的生態(tài)系統(tǒng)非常豐富，包括許多相關(guān)工具和技術(shù)，如Hive、Pig、HBase等，這些工具可以方便地構(gòu)建復(fù)雜的大數(shù)據(jù)應(yīng)用。Hadoop廣泛應(yīng)用于各種場景，包括數(shù)據(jù)處理和分析、

發(fā)表于 10-08 15:12 ?273次閱讀

基于大數(shù)據(jù)與深度學(xué)習(xí)的穿戴式運動心率算法

性能的關(guān)鍵手段。然而，在復(fù)雜多變的運動環(huán)境中，準(zhǔn)確測量心率數(shù)據(jù)對于傳統(tǒng)算法而言具有較大的技術(shù)瓶頂。本文將探討如何運用大數(shù)據(jù)和深度學(xué)習(xí)技術(shù)來開發(fā)創(chuàng)新的穿戴式運動心率算

發(fā)表于 09-10 08:03 ?481次閱讀

【《大語言模型應(yīng)用指南》閱讀體驗】+ 基礎(chǔ)知識學(xué)習(xí)

收集海量的文本數(shù)據(jù)作為訓(xùn)練材料。這些數(shù)據(jù)集不僅包括語法結(jié)構(gòu)的學(xué)習(xí)，還包括對語言的深層次理解，如文化背景、語境含義和情感色彩等。自監(jiān)督學(xué)習(xí)：模型采用自

發(fā)表于 08-02 11:03

【《大語言模型應(yīng)用指南》閱讀體驗】+ 基礎(chǔ)篇

章節(jié)最后總結(jié)了機器學(xué)習(xí)的分類：有監(jiān)督學(xué)習(xí)、無監(jiān)督學(xué)習(xí)、半監(jiān)督學(xué)習(xí)、自監(jiān)督學(xué)習(xí)和強化

發(fā)表于 07-25 14:33

機器學(xué)習(xí)中的數(shù)據(jù)分割方法

在機器學(xué)習(xí)中，數(shù)據(jù)分割是一項至關(guān)重要的任務(wù)，它直接影響到模型的訓(xùn)練效果、泛化能力以及最終的性能評估。本文將從多個方面詳細(xì)探討機器學(xué)習(xí)中數(shù)據(jù)分割的方法，包括常見的分割方法、各自的優(yōu)缺點、

發(fā)表于 07-10 16:10 ?2733次閱讀

神經(jīng)網(wǎng)絡(luò)如何用無監(jiān)督算法訓(xùn)練

神經(jīng)網(wǎng)絡(luò)作為深度學(xué)習(xí)的重要組成部分，其訓(xùn)練方式多樣，其中無監(jiān)督學(xué)習(xí)是一種重要的訓(xùn)練策略。無監(jiān)督學(xué)習(xí)旨在從未標(biāo)記的

發(fā)表于 07-09 18:06 ?1212次閱讀

深度學(xué)習(xí)中的無監(jiān)督學(xué)習(xí)方法綜述

應(yīng)用中往往難以實現(xiàn)。因此，無監(jiān)督學(xué)習(xí)在深度學(xué)習(xí)中扮演著越來越重要的角色。本文旨在綜述深度學(xué)習(xí)中的無監(jiān)督學(xué)

發(fā)表于 07-09 10:50 ?1346次閱讀

深度學(xué)習(xí)的基本原理與核心算法

隨著大數(shù)據(jù)時代的到來，傳統(tǒng)機器學(xué)習(xí)方法在處理復(fù)雜模式上的局限性日益凸顯。深度學(xué)習(xí)（Deep Learning）作為一種新興的人工智能技術(shù)，以其強大的非線性表達(dá)能力和自學(xué)習(xí)能力，在圖像識

發(fā)表于 07-04 11:44 ?3152次閱讀

機器學(xué)習(xí)在數(shù)據(jù)分析中的應(yīng)用

隨著大數(shù)據(jù)時代的到來，數(shù)據(jù)量的爆炸性增長對數(shù)據(jù)分析提出了更高的要求。機器學(xué)習(xí)作為一種強大的工具，通過訓(xùn)練模型從數(shù)據(jù)中

發(fā)表于 07-02 11:22 ?1103次閱讀

基于FPGA的類腦計算平臺 —PYNQ 集群的無監(jiān)督圖像識別類腦計算系統(tǒng)

STDP 無監(jiān)督學(xué)習(xí)算法，可運用于圖像的無監(jiān)督分類。從平臺設(shè)計角度： (1)本設(shè)計搭建的基于 PYNQ 集群的通用低功耗的大規(guī)模類腦計算平臺，搭載 PYNN，NEST 等

發(fā)表于 06-25 18:35

深度學(xué)習(xí)編譯工具鏈中的核心——圖優(yōu)化

深度神經(jīng)網(wǎng)絡(luò)模型可以看做由多個算子連接而成的有向無環(huán)圖，圖中每個算子代表一類操作（如乘法、卷積），連接各個算子的邊表示數(shù)據(jù)流動。在部署深度神經(jīng)網(wǎng)絡(luò)的過程中，為了適應(yīng)硬件平臺的優(yōu)化、硬件本身支持的算子

發(fā)表于 05-16 14:24 ?1425次閱讀

圖機器學(xué)習(xí)入門：基本概念介紹

圖機器學(xué)習(xí)（GraphMachineLearning，簡稱GraphML）是機器學(xué)習(xí)的一個分支，專注于利用圖形結(jié)構(gòu)的數(shù)據(jù)。在圖形結(jié)構(gòu)中，數(shù)據(jù)

發(fā)表于 05-16 08:27 ?665次閱讀

無監(jiān)督深度學(xué)習(xí)實現(xiàn)單次非相干全息3D成像

論文信息背景引入數(shù)字全息術(shù)因其能夠從單一視點對3D場景進(jìn)行成像而備受關(guān)注。與直接成像相比，數(shù)字全息是一種間接的多步驟成像過程，包括光學(xué)記錄全息圖和數(shù)值計算重建，為包括深度學(xué)習(xí)在內(nèi)的計算成像方法

發(fā)表于 05-13 17:38 ?694次閱讀