隨著人工智能大火,我們身邊幾乎處處充滿著AL的氣息,就連停車,都是機(jī)器人值班了。
可是很多人都不知道人工智能是由什么開發(fā)的,各種相關(guān)聯(lián)的框架都是以Python作為主要語言開發(fā)出來的。
Python本身很普通,是所有編程語言中和自然語言或者說偽代碼最像的,更為可貴的是其中一些特殊的庫非常方便和強(qiáng)大,像numpy, scipy, matplotlib。
如果是一名新手想學(xué)習(xí)編程,一般都是選擇python,因?yàn)楦菀咨鲜?,并且,從Python學(xué)起,很快就能運(yùn)用Python編程的底層邏輯去學(xué)習(xí)另外的語言,也就是說,學(xué)習(xí)Python是學(xué)習(xí)編程的絕佳起點(diǎn)。
接下來小編教大家如何快速入門,節(jié)約時(shí)間,能夠一邊工作一邊學(xué)新知識!
學(xué)習(xí)基礎(chǔ)知識
掌握元素(列表、字典、元組等)、變量、循環(huán)、函數(shù)等基礎(chǔ)知識,達(dá)到能夠熟練編寫代碼,至少不能出現(xiàn)語法錯(cuò)誤。
1.交互式解釋器
在命令行窗口執(zhí)行python后,進(jìn)入 Python 的交互式解釋器。exit() 或Ctrl + D 組合鍵退出交互式解釋器。
2.命令行腳本
在命令行窗口執(zhí)行python script-file.py,以執(zhí)行 Python 腳本文件。
3.指定解釋器
如果在 Python 腳本文件首行輸入#!/usr/bin/env python,那么可以在命令行窗口中執(zhí)行/path/to/script-file.py以執(zhí)行該腳本文件。
運(yùn)算符合集
算術(shù)運(yùn)算符:
比較運(yùn)算符:
賦值運(yùn)算符:
成員運(yùn)算符:
這個(gè)階段最重要的就是:學(xué)好基礎(chǔ)知識。掌握了基礎(chǔ)之后,便可以開始做項(xiàng)目練習(xí)鍛煉編程思維了。
學(xué)習(xí)爬蟲知識
所謂爬蟲,就是按照一定的規(guī)則,自動(dòng)的從網(wǎng)絡(luò)中抓取信息的程序或者腳本。萬維網(wǎng)就像一個(gè)巨大的蜘蛛網(wǎng),我們的爬蟲就是上面的一個(gè)蜘蛛,不斷的去抓取我們需要的信息。
基礎(chǔ)的抓取操作:
1、urllib
在Python2.x中我們可以通過urllib 或者urllib2 進(jìn)行網(wǎng)頁抓取,但是再Python3.x 移除了urllib2。只能通過urllib進(jìn)行操作
帶參數(shù)的urllib
url = 'https://blog.csdn.net/weixin_43499626'
url = url + '?' + key + '=' + value1 + '&' + key2 + '=' + value2
2、requests
requests庫是一個(gè)非常實(shí)用的HTPP客戶端庫,是抓取操作最常用的一個(gè)庫。Requests庫滿足很多需求
常見的反爬有哪些
1、通過user-agent來控制訪問
user-agent能夠使服務(wù)器識別出用戶的操作系統(tǒng)及版本、cpu類型、瀏覽器類型和版本。很多網(wǎng)站會設(shè)置user-agent白名單,只有在白名單范圍內(nèi)的請求才能正常訪問。所以在我們的爬蟲代碼中需要設(shè)置user-agent偽裝成一個(gè)瀏覽器請求。
2、通過IP來限制
當(dāng)我們用同一個(gè)ip多次頻繁訪問服務(wù)器時(shí),服務(wù)器會檢測到該請求可能是爬蟲操作。因此就不能正常的響應(yīng)頁面的信息了。
存儲
通過分析網(wǎng)頁內(nèi)容,獲取到我們想要的數(shù)據(jù),我們可以選擇存到文本文件中,亦可以存儲在數(shù)據(jù)庫中,常用的數(shù)據(jù)庫有MySql、MongoDB
存儲為json文件
存儲為cvs文件
存儲到Mongo
以上知識雖然只是皮毛,給大家整理了一些知識,不過想要深入了解,還需要自己去學(xué)習(xí), 在學(xué)習(xí)中有迷茫不知如何學(xué)習(xí)的朋友小編推薦去“蟻小二”,打破傳統(tǒng)學(xué)習(xí),每一課程一個(gè)小時(shí)就搞定,或者關(guān)注小編,傳授你們更多python知識!
-
機(jī)器人
+關(guān)注
關(guān)注
211文章
28445瀏覽量
207224 -
人工智能
+關(guān)注
關(guān)注
1791文章
47314瀏覽量
238648 -
python
+關(guān)注
關(guān)注
56文章
4797瀏覽量
84727
發(fā)布評論請先 登錄
相關(guān)推薦
評論