您好,歡迎來(lái)電子發(fā)燒友網(wǎng)! ,新用戶?[免費(fèi)注冊(cè)]

您的位置:電子發(fā)燒友網(wǎng)>源碼下載>數(shù)值算法/人工智能>

幾個(gè)機(jī)器學(xué)習(xí)面試問(wèn)題解析從容應(yīng)對(duì)面試

大?。?/span>0.2 MB 人氣: 2017-09-22 需要積分:1

  幾個(gè)機(jī)器學(xué)習(xí)面試問(wèn)題解析從容應(yīng)對(duì)面試

  ▍目錄

  全局

  優(yōu)化

  數(shù)據(jù)預(yù)處理

  抽樣和拆分

  監(jiān)督學(xué)習(xí)

  無(wú)監(jiān)督學(xué)習(xí)

  模型評(píng)估

  集成學(xué)習(xí)

  商業(yè)應(yīng)用

  ▍全局

  基本的ML理論,如偏差方差權(quán)衡。

  向外行人解釋機(jī)器學(xué)習(xí)。

  想象一個(gè)好奇的孩子,將他的手掌放在蠟燭火焰上,并在感受到短暫的灼熱后立刻把手縮回來(lái)。第二天,他碰到一個(gè)熱的爐子,頂部看到紅色,感覺(jué)到前一天像蠟燭一樣的熱浪。

  這個(gè)孩子從來(lái)沒(méi)有碰過(guò)爐灶,但幸運(yùn)的是,他從以前的數(shù)據(jù)中學(xué)到了,避免了紅色的灼傷。

  “擬合”模型意味著什么?超參數(shù)如何相關(guān)?

  擬合模型是使用訓(xùn)練數(shù)據(jù)學(xué)習(xí)模型參數(shù)的過(guò)程。

  參數(shù)有助于定義機(jī)器學(xué)習(xí)模型的數(shù)學(xué)公式。

  然而,還有一些稱為超參數(shù)的數(shù)據(jù)不能被學(xué)習(xí)的“較高級(jí)”參數(shù)。

  超參數(shù)定義模型的屬性,如模型復(fù)雜度或?qū)W習(xí)率。

  解釋偏差方差權(quán)衡。

  預(yù)測(cè)模型在偏差(擬合模型數(shù)據(jù)的方式)和方差(基于輸入變化的多少)之間有權(quán)衡。

  更簡(jiǎn)單的模型是穩(wěn)定的(低方差),但它們不接近真相(高偏差)。

  更復(fù)雜的模型更容易被過(guò)度使用(高差異),但它們具有足夠的表達(dá)能夠接近真實(shí)性(低偏倚)。

  給定問(wèn)題的最佳模式通常位于中間的某處。

  ▍優(yōu)化

  找到模型最佳參數(shù)的算法。

  隨機(jī)梯度下降(SGD)和梯度下降(GD)之間有什么區(qū)別?

  兩種算法都是通過(guò)對(duì)數(shù)據(jù)進(jìn)行參數(shù)評(píng)估,然后進(jìn)行調(diào)整,找到一組最小化損失函數(shù)的參數(shù)的方法。

  在標(biāo)準(zhǔn)梯度下降中,您將評(píng)估每組參數(shù)的所有訓(xùn)練樣本。這類似于為解決這個(gè)問(wèn)題而采取了大而緩慢的步驟。

  在隨機(jī)梯度下降中,在更新參數(shù)集之前,您只需評(píng)估1個(gè)訓(xùn)練樣本。這類似于向解決方案邁出的小步驟。

  什么時(shí)候使用GD超過(guò)SDG,反之亦然?

  GD理論上最大限度地減少誤差函數(shù)比SGD更好。然而,一旦數(shù)據(jù)集變大,SGD就會(huì)收斂得更快。

  這意味著GD對(duì)于小數(shù)據(jù)集是優(yōu)選的,而SGD對(duì)于較大的數(shù)據(jù)是優(yōu)選的。

  然而,實(shí)際上,SGD用于大多數(shù)應(yīng)用程序,因?yàn)樗梢詫⒄`差函數(shù)最小化,同時(shí)為大型數(shù)據(jù)集提供更快的速度和更高的內(nèi)存效率。

  ▍數(shù)據(jù)預(yù)處理

  處理丟失的數(shù)據(jù),偏態(tài)分布,異常值等

  什么是Box-Cox轉(zhuǎn)換?

  Box-Cox轉(zhuǎn)換是一種廣泛的“權(quán)力轉(zhuǎn)型”,它轉(zhuǎn)換數(shù)據(jù),使分布更加正常。

  例如,當(dāng)lambda參數(shù)為0時(shí),它相當(dāng)于對(duì)數(shù)轉(zhuǎn)換。

  它用于穩(wěn)定方差(消除異方差)并使分布正?;?。

  什么是3種數(shù)據(jù)預(yù)處理技術(shù)來(lái)處理異常值?

  1.Winsorize(cap 閾值)。

  2.轉(zhuǎn)換以減少偏態(tài)(使用Box-Cox或類似的)。

  3.如果你確定它們是異常或測(cè)量錯(cuò)誤,請(qǐng)刪除異常值。

非常好我支持^.^

(0) 0%

不好我反對(duì)

(0) 0%

      發(fā)表評(píng)論

      用戶評(píng)論
      評(píng)價(jià):好評(píng)中評(píng)差評(píng)

      發(fā)表評(píng)論,獲取積分! 請(qǐng)遵守相關(guān)規(guī)定!

      ?