bert算法詳解-tft每日頭條

bert算法詳解

生活更新时间:2026-07-14 18:11:36

什麼是感知機「Perceptron」

PLA全稱是Perceptron Linear Algorithm，即線性感知機算法，屬于一種最簡單的感知機（Perceptron）模型。

感知機模型是機器學習二分類問題中的一個非常簡單的模型。它的基本結構如下圖所示：

bert算法詳解（簡單能看懂的感知機算法PLA）1

其中，x

xi是輸入，w

wi表示權重系數，b

b表示偏移常數。感知機的線性輸出為：

scores=∑

scores=∑iNwixi b

為了簡化計算，通常我們将b

b作為權重系數的一個維度，即w

w0。同時，将輸入x

x擴展一個維度，為1。這樣，上式簡化為：

scores=∑

N 1

scores=∑iN 1wixi

scores

scores是感知機的輸出，接下來就要對scores

scores進行判斷：

若scores≥0
scores≥0，則y
^
=1
y^=1（正類）
若scores<0
scores<0，則y
^
=−1
y^=−1（負類）

以上就是線性感知機模型的基本概念，簡單來說，它由線性得分計算和阈值比較兩個過程組成，最後根據比較結果判斷樣本屬于正類還是負類。

PLA理論解釋

對于二分類問題，可以使用感知機模型來解決。PLA的基本原理就是逐點修正，首先在超平面上随意取一條分類面，統計分類錯誤的點；然後随機對某個錯誤點就行修正，即變換直線的位置，使該錯誤點得以修正；接着再随機選擇一個錯誤點進行糾正，分類面不斷變化，直到所有的點都完全分類正确了，就得到了最佳的分類面。

利用二維平面例子來進行解釋，第一種情況是錯誤地将正樣本（y=1）分類為負樣本（y=-1）。此時，wx<0

wx<0，即w

w與x

x的夾角大于90度，分類線l

l的兩側。修正的方法是讓夾角變小，修正w

w值，使二者位于直線同側：

w:=w x=w yx

修正過程示意圖如下所示：

bert算法詳解（簡單能看懂的感知機算法PLA）2

第二種情況是錯誤地将負樣本（y=-1）分類為正樣本（y=1）。此時，wx>0

wx>0，即w

w與x

x的夾角小于90度，分類線l

l的同一側。修正的方法是讓夾角變大，修正w

w值，使二者位于直線兩側：

w:=w−x=w yx

修正過程示意圖如下所示：

bert算法詳解（簡單能看懂的感知機算法PLA）3

經過兩種情況分析，我們發現PLA每次w

w的更新表達式都是一樣的：w:=w yx

w:=w yx。掌握了每次w

w的優化表達式，那麼PLA就能不斷地将所有錯誤的分類樣本糾正并分類正确。

數據準備

導入數據

數據集存放在’../data/’目錄下，該數據集包含了100個樣本，正負樣本各50，特征維度為2。

import numpy as np import pandas as pd data = pd.read_csv('./data/data1.csv', header=None) # 樣本輸入，維度（100，2） X = data.iloc[:,:2].values # 樣本輸出，維度（100，） y = data.iloc[:,2].values 1 2 3 4 5 6 7 8

數據分類與可視化

下面我們在二維平面上繪出正負樣本的分布情況。

import matplotlib.pyplot as plt plt.scatter(X[:50, 0], X[:50, 1], color='blue', marker='o', label='Positive') plt.scatter(X[50:, 0], X[50:, 1], color='red', marker='x', label='Negative') plt.xlabel('Feature 1') plt.ylabel('Feature 2') plt.legend(loc = 'upper left') plt.title('Original Data') plt.show() 1 2 3 4 5 6 7 8 9

bert算法詳解（簡單能看懂的感知機算法PLA）4

PLA算法

特征歸一化

首先分别對兩個特征進行歸一化處理，即：

X=X−μ

X=X−μσ

其中，μ

μ是特征均值，σ

σ是特征标準差。

# 均值 u = np.mean(X, axis=0) # 方差 v = np.std(X, axis=0) X = (X - u) / v # 作圖 plt.scatter(X[:50, 0], X[:50, 1], color='blue', marker='o', label='Positive') plt.scatter(X[50:, 0], X[50:, 1], color='red', marker='x', label='Negative') plt.xlabel('Feature 1') plt.ylabel('Feature 2') plt.legend(loc = 'upper left') plt.title('Normalization data') plt.show() 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

bert算法詳解（簡單能看懂的感知機算法PLA）5

直線初始化

# X加上偏置項 X = np.hstack((np.ones((X.shape[0],1)), X)) # 權重初始化 w = np.random.randn(3,1) 1 2 3 4

顯示初始化直線位置：

# 直線第一個坐标（x1，y1） x1 = -2 y1 = -1 / w[2] * (w[0] * 1 w[1] * x1) # 直線第二個坐标（x2，y2） x2 = 2 y2 = -1 / w[2] * (w[0] * 1 w[1] * x2) # 作圖 plt.scatter(X[:50, 1], X[:50, 2], color='blue', marker='o', label='Positive') plt.scatter(X[50:, 1], X[50:, 2], color='red', marker='x', label='Negative') plt.plot([x1,x2], [y1,y2],'r') plt.xlabel('Feature 1') plt.ylabel('Feature 2') plt.legend(loc = 'upper left') plt.show() 1 2 3 4 5 6 7 8 9 10 11 12 13 14

bert算法詳解（簡單能看懂的感知機算法PLA）6

由上圖可見，一般随機生成的分類線，錯誤率很高。

計算scores，更新權重

接下來，計算scores，得分函數與阈值0做比較，大于零則y

y^=1，小于零則y

=−1

y^=−1

s = np.dot(X, w) y_pred = np.ones_like(y) # 預測輸出初始化 loc_n = np.where(s < 0)[0] # 大于零索引下标 y_pred[loc_n] = -1 1 2 3 4

接着，從分類錯誤的樣本中選擇一個，使用PLA更新權重系數w

w。

# 第一個分類錯誤的點 t = np.where(y != y_pred)[0][0] # 更新權重w w = y[t] * X[t, :].reshape((3,1)) 1 2 3 4

叠代更新訓練

更新權重w

w是個叠代過程，隻要存在分類錯誤的樣本，就不斷進行更新，直至所有的樣本都分類正确。（注意，前提是正負樣本完全可分）

for i in range(100): s = np.dot(X, w) y_pred = np.ones_like(y) loc_n = np.where(s < 0)[0] y_pred[loc_n] = -1 num_fault = len(np.where(y != y_pred)[0]) print('第-次更新，分類錯誤的點個數：-' % (i, num_fault)) if num_fault == 0: break else: t = np.where(y != y_pred)[0][0] w = y[t] * X[t, :].reshape((3,1)) 1 2 3 4 5 6 7 8 9 10 11 12

叠代完畢後，得到更新後的權重系數w

w，繪制此時的分類直線是什麼樣子。

bert算法詳解（簡單能看懂的感知機算法PLA）7

其實，PLA算法的效率還算不錯，隻需要數次更新就能找到一條能将所有樣本完全分類正确的分類線。所以得出結論，對于正負樣本線性可分的情況，PLA能夠在有限次叠代後得到正确的分類直線。

總結與疑問

這裡導入的數據本身就是線性可分的，可以使用PCA來得到分類直線。但是，如果數據不是線性可分，即找不到一條直線能夠将所有的正負樣本完全分類正确，這種情況下，似乎PCA會永遠更新叠代下去，卻找不到正确的分類線。

更多精彩资讯请关注tft每日頭條，我们将持续为您更新最新资讯!

查看全部

网友关注

生活河南香酥糟魚
去過商丘，了解商丘的人都知道，商丘城有大湖。古城商丘，黃河古道和城内大湖的作用下，其實，就催生了靠山吃山靠水吃水的小吃兒。糟魚就是這個原因産生的，很有點得魚水之歡，享人間口福的意思。糟魚吃法很簡單，加熱後就可以吃。褐色魚皮下的魚肉，緊而白... 2023-01-15
生活常見醒酒方法
常見醒酒方法?糖水解酒解酒可以利用糖水，直接取适量的白糖，然後用開水沖服即可，飲用後可以解酒醒腦，下面我們就來說一說關于常見醒酒方法?我們一起去了解并探讨一下這個問題吧!常見醒酒方法糖水解酒解酒可以利用糖水，直接取适量的白糖，然後用開水沖服... 2022-07-10
生活岑參生平故事
時間：唐玄宗李隆基天寶十三年，也就是公元754年，此時還沒有爆發導緻唐朝由盛而衰的安史之亂。這時的唐朝依舊是繁榮的盛世局面，全國人口已達八千萬，除了國力非常強盛外，大唐的商業也非常發達，商業造就的繁華都市也很多。地點：涼州，此時的涼州已經是... 2023-01-03
生活從一分耕耘一分收獲談人生發展
幼兒園今天過元旦，老師說大家都帶一些零食過來，小朋友可以一起分享着吃。我去超市買了一堆，各種各樣的都給孩子裝了一些。孩子的爸說我裝的太多了，哪能吃得了那麼多。我想着好吃的肯定都愛吃，大不了吃不了再拿回來。元旦是個喜慶的日子。因為疫情已經很久... 2023-01-26
生活蓓蕾少兒美術培訓活動注意事項
“陽光美育”是渭南市群衆文化藝術培訓學校為少年兒童精心打造的文化藝術培訓項目，截至今年已累計有千餘名孩子參加了培訓。2022年陽光美育暑期少兒培訓班開始招生，歡迎适齡兒童踴躍報名。一、報名時間2022年7月4日—7月10日（9:00—17:... 2023-04-03
生活這幾種觀賞魚比較難以飼養
各位魚友大家好，我是養魚老道，更多觀賞魚飼養、繁育實踐知識，敬請大家關注！為什麼養魚老道的魚缸空缸放置了那麼長的時間，我也不着急去購買觀賞魚，而在近期才開始逐步購買？很簡單的道理，就是始終沒有碰到我自己能夠中意的觀賞魚，這個中意至少要符合以... 2023-02-09
生活信不信有譚小環在
最近很火的綜藝自然是《無限超越班》，在這檔綜藝裡我們看到很多久違的TVB演員的身影，其中就有52歲的張可頤。坦白講，當小編聽到張可頤52歲的時候，還是大吃一驚，英氣幹練的短發，白皙的皮膚，整個人發光發亮，說她三十出頭，也沒人會懷疑的。選秀是... 2023-03-05
生活什麼是他山之石可以攻玉
在古代流傳下來的詩詞名句有很多，但是中國曆史經過了上下五千年的流轉，朝代的更替，在曆史長河中，在詩詞成語的流傳過程中，如果不小心誤傳了一個字，或者是傳錯了意思，那可就大錯特錯了。例如，有個成語叫"無奸不商"，明明本來就是&#... 2023-02-15
生活鋁合金切削液哪裡有
鋁合金在物理功能上與大部分鋼材和鑄鐵材料相比，具有許多明顯的特點。純鋁強度低，硬度低、塑性大，适合于塑性成型加工，但切削加工時變形強化傾向大，易粘刀，很難加工出光潔的外表。鋁合金在強度、硬度與純鋁相比進步許多，但與鋼材相比強度與硬度低，切削... 2023-03-05
生活學校食品安全問題怎麼辦
俗話說得好，民以食為天。從古至今，中國人每逢見面就習慣以一句“吃了嗎”作為友好寒暄的開頭，哪怕是走在熱鬧的大街小巷，滿街飄香的飯菜味也是出自我們對美食的寄托。國人對“吃好、喝好”的執念程度可見一斑，而對食品原料的幹淨衛生的把控，就更是基本要... 2023-03-30
生活女性胸椎側彎的危害
女性胸椎側彎的危害?脊柱側彎是臨床上不是非常常見的一個疾病，但是可以是給病人帶來嚴重的生活上和工作上等等方面的影響脊柱側彎往往是進展性的，影響頸椎、胸椎、腰椎，由于脊柱的生長不對稱，可以出現胸廓和骨盆的變形，下面我們就來聊聊關于女性胸椎側彎... 2022-06-05
生活火影忍者曉組織十大實力排名
“曉”，日本漫畫《火影忍者》及其衍生作品中的一個秘密組織。成員身穿繡着紅雲的黑色風衣，頭戴系着風鈴的鬥笠，相應手指佩戴标有自己代号的戒指（右手大拇指到左手大拇指依次為：零、青、白、朱、玄、空、南、北、三、玉），指甲塗有指甲油，護額上有一道劃... 2023-03-01
生活欣妤名字的意思
欣妤名字的意思?欣妤名字的意思：歡欣、美麗欣指歡欣、喜悅，後引申指愛戴，又由此引申指賞慕，引證：鄒韬奮《萍蹤寄語》七五：“我們在這可愛的女孩的音容笑貌上看得出她心裡的欣悅和自豪的情緒”，今天小編就來聊一聊關于欣妤名字的意思?接下來我們就一起... 2022-06-21
生活貧困戶對學校的感謝信怎麼寫
自貢網訊（記者曾鵬程黃鴻）今年6月，富順縣琵琶鎮人民政府收到一份來自河南理工大學的感謝信，寫信者是該校大四學生、琵琶鎮青峰村9組貧困學生田德才。“今年是打赢脫貧攻堅戰的收官之年。在此之際，我懷着萬分感激之情寫下這封信，希望能夠借着這封信感謝... 2023-03-11
生活可惜沒如果表達什麼意思
可惜沒有如果，人生無法重來，有的遇見成了過錯，有的不見成了錯過，失去的總是美好，得到的卻不珍惜。這個世上最難吃到的藥是後悔藥，後悔沒有早一點明白，後悔沒有早一點遇見，假如當初勇敢一點，假如曾經努力一點，也許現在就不會有後悔的可能，可是，誰又... 2023-03-13
生活地獄傳送門要幾個黑曜石
自從lol推出傳送門活動後，許多小夥伴在傳送門裡獲得了許多的皮膚。而傳送門又是分為兩部分的，一部分是傳送門，一部分是符石，而打開傳送門需要的是符石，就相當于傳送門是箱子，而符石是鑰匙；一個符石開一個傳送門。至于傳送門和符石的獲取途徑是，隻要... 2022-12-28
生活香菜最容易生什麼病
我不是厭惡香菜的人（事實上，我喜歡它），但我對另一種蔬菜"芹菜"确實存在嚴重問題。我非常讨厭它,甚至不能把它放在我的冰箱裡。因為我甚至無法忍受打開冰箱門，并聞到它可怕的氣味。我對芹菜有強烈的厭惡，以至于我可以完全與那些讨厭香菜的人聯系在一起... 2023-02-24
生活溫故而知新誰提出的
第一局回顧：第1題唐代詩人杜甫詩歌風格多樣，但最主要的風格還是“（）”正确答案：沉郁頓挫唐代詩人杜甫詩歌風格多樣，但最主要的風格還是“沉郁頓挫”。“沉郁”主要是指感情深沉蒼涼、境界開闊壯大；“頓挫”則指語言剛健、音調铿锵和章法多變。第2題蘋... 2023-04-04
生活貝索斯成為世界首富嗎
美東時間7月20日9時12分，世界首富、亞馬遜創始人傑夫·貝索斯乘坐藍色起源公司自主研發的太空艙，由該公司自主研發的火箭從得克薩斯州範霍恩“一号發射場”發射升空，進入距離地面66英裡的太空，體驗了4分鐘失重狀态。傑夫·貝索斯（左二）、傑夫的... 2023-01-18
生活撒貝甯的妻子李白身高年齡
新京報訊12月15日，撒貝甯的妻子李白在社交媒體發文證實産下龍鳳胎，她寫道，“12月10日，我們在這個世界迎來了兩顆小星星，我們的心永遠屬于你們。”此前，李白曾在社交媒體上曬圖，證實孩子為一男一女。李白是加拿大人，曾經是“五洲唱響”組合成員... 2023-02-21
生活 dnf白嫖五一套完整操作
體驗服已經實裝了有關兌換春節時裝的内容。據目前的版本來看，兌換一套春節套需要75個困難領主的材料。而挑戰困難領主一次需要30點PL，每次僅掉落一個。少部分歐洲狗可以獲得直接在副本掉落一套的特權。以188PL來計算，單角色一天最多可以獲得6個... 2023-03-01
生活這個季節必備清單
氣溫回升你家開始洗洗曬曬了嗎？随着天氣回暖冬裝已經完成使命，退出舞台近些天的晴暖天氣最适合洗曬收藏冬衣冬被了雖說隻是洗淨、曬幹、入櫃六個字但其中的學問可大着呢小鯉特地為大家夥兒整理了《換季洗護攻略》趕緊點贊、收藏起來吧~(一)衣物洗護1、毛... 2022-11-28
生活剛認識的女生該怎麼聊不尴尬
昨天有個小老弟問我：“剛認識了一個女生，該怎麼聊才能快速打開話題，又能避免讓對方感覺不舒服呢？”這裡晨哥就給大家支3招：1、用陳述句代替疑問句打開話題對于剛認識的女生，很多人下意識的開場都是：你住哪兒啊？你喜歡吃什麼啊？你平時都幹些啥啊？一... 2023-01-27
生活香奈兒chanel耳飾
記者|羅天奕編輯|樓婍沁CHANEL2021春夏新品發箍時尚的小心機往往體現在各種配飾小細節上，各大品牌也紛紛在配飾上推陳出新。香奈兒2021春夏系列中的頭飾新品就頗為亮眼，除了此前推薦過的多功能發帶外，香奈兒的新品發箍也非常百搭且體現品味... 2023-03-25
生活他山之石可以攻玉類似的句子
他山之石可以攻玉類似的句子?鶴鳴于九臯，聲聞于野魚潛在淵，或在于渚，今天小編就來說說關于他山之石可以攻玉類似的句子?下面更多詳細答案一起來看看吧!他山之石可以攻玉類似的句子鶴鳴于九臯，聲聞于野。魚潛在淵，或在于渚。樂彼之園，爰有樹檀，其下維... 2023-02-15
生活 nsx賽車測評
發行商Nacon宣布最新一期“Naconconnect”發布會将于北京時間7月8日淩晨1點舉辦，展出内容包括《無限試駕太陽王冠》首個實機演示、《魔戒咕噜》、《機械戰警惡棍之城》等17款遊戲，其中5款還尚未對外公開。相關新聞：《無限試駕太陽... 2023-01-09
生活華翔手機号主卡和副卡是什麼意思
上一期我們介紹了華翔聯信的公司、購卡方式、購卡流程、套餐内容等，咱們購買的霸王龍套餐卡到貨了，這期咱們介紹一下如何開卡激活。華翔聯信激活流程：第一步、首先打開微信，進入華翔聯信公衆号；第二步、在公衆号裡底部找到辦理，點擊進入，點擊号碼激活；... 2023-02-13
生活陳華森區長
福建省三明市有兩張靓麗名片：革命老區和精神文明城市。這裡，敢為人先、依靠群衆、創新争先的精神一直延續至今，凝聚起磅礴奮進力量，激勵着一代又一代老區人民砥砺前行。三明市應急管理局辦公室主任陳華森，就是這片紅土地上的一張“應急名片”。作為一名從... 2023-01-17
生活壁挂飲水機怎麼清理熱水口
導語：如今，人們對飲用水的需求越來越高，許多人在家裡買水喝，但是許多人忽視了一個非常重要的問題，那就是家用壁挂飲水機的清潔。家用壁挂飲水機在使用一段時間後需要清洗和維護。所以家用壁挂飲水機的清潔問題是值得關注的。那麼，大家知道家用壁挂飲水機... 2023-02-01
生活康姿百德磁性床墊
康姿百德磁性床墊?兒童床墊的好壞對于寶寶的健康發育有非常重要的影響寶寶在兒童發育時期，在床上睡覺的時間明顯多于活動的時間，而且此時的寶寶各方面身體機能顯著發育的時期，兒童床墊的好壞直接關系着孩子的脊椎健康和睡眠質量，我來為大家科普一下關于康... 2023-01-23

tft每日頭條

> 生活

> bert算法詳解

bert算法詳解

相关生活资讯推荐

热门生活资讯推荐

网友关注