tft每日頭條

 > 生活

 > 對信息進行數據分析

對信息進行數據分析

生活 更新时间:2025-01-26 06:10:08

這是《給年輕人的跨學科工具箱》第十五篇筆記,如果覺得不錯,可以去B站購買所長的課程。

上一篇文章人類學模型——為什麼是智人勝出?主要介紹了人類進化史中,智人得以從衆多人類中勝出的原因是想象與共識。然後從進化心理學的角度解釋了為什麼男性會更加專注,為什麼我們熱愛吃甜食。以及介紹了一個新概念,文化人類學中的模因,以及人類另一種延續的方式。


本篇文章主要介紹包括以下内容:

  1. 人類最重要的三條公式
  2. 信息熵
  3. 霍夫曼編碼
  4. 幀間壓縮算法
  5. 互信息、冗餘度

閱讀本篇文章可以回答不限于以下問題:

  • 如何合理地分配資源?
  • 如何有效地去除冗餘度?
  • 如何做到一年讀上百本書?
  • 如何高效地學習?
  • 如何畫腦圖?

三條重要公式

張首晟教授認為對人類來講,有三條最重要的公式:

  • 第一條,描述的是物質和能量的關系
  • 第二條,香農的信息熵公式,描述的是信息如何量化。
  • 第三條,是海森堡測不準原理,描述的是科學 的邊界

對信息進行數據分析(信息論模型合理配置資源)1

E=mc^2

對信息進行數據分析(信息論模型合理配置資源)2

宇宙最重要的兩個概念,能量和信息。之所以沒有物質,是因為由上圖可知,能量和物質是相通的。之所以會有第三條公式,是因為他是量子力學的範疇,是告訴我們科學的邊界在哪裡,無論科學怎麼發展,我們都無法測算基本粒子的狀态,因為我們觀察粒子這件事情,本身就會改變他的行為。

由于我們觀察粒子,會需要一個光子打在粒子身上,但這個行為會改變基本粒子的行進軌迹,因為他會吸收光子的動量,而瞬間改變自己的狀态,也就是說,我們的觀察改變了客觀世界。

因此第三條公式給我們的啟發是,這個世界,沒有絕對客觀的存在,人類觀察世界的方式和角度和這個世界對待我們的方式和方法,會從物理學的層面影響彼此,我們觀察到的東西實際上是客觀世界和主管想象之間的結合體

信息熵

能量守恒,但信息不守恒。信息可以複制和分享,并不存在你分享他人,你的信息就會變少。因此人類之間分享知識,是一件可以為這個世界創造純粹增量的事情。

信息是怎麼衡量的?

可以用質量衡量物質,信息量衡量信息。要理解信息量,需要理解信息熵的概念。

信息熵是描述一個東西的不确定程度的量。通俗點理解,就是搞清楚一件事情的難度。

比如你去買一印着圖案的娃娃,他的信息熵為0,因為盒子上的圖案,就是娃娃的樣子。但若去開一個盲盒,信息熵就陡然增大。影響信息熵的三個因素

  1. 可能出現的娃娃款式越大,信息熵就越大
  2. 在娃娃款式數量不變的情況下,如果每一款出現大概率是一樣的,這個時候信息熵最大
  3. 如果其中某一個款式,出現的概率很大,那麼信息熵就會大大降低。
信息量

信息量,就是把信息熵消除掉的信息所需要的能量,基本單位為比特

對信息進行數據分析(信息論模型合理配置資源)3

比如,同事問你中午吃什麼,你說随便,這個時候信息熵最大,因為具有無限可能,但如果說不吃辣,信息熵就會降低,如果指定某一家的時候,信息熵降為0。

不做選擇,随波逐流,或者平均分配注意力,就會增加整個系統的無序性,如何聰明地分配我們的資源和注意力,這就要講到信息論裡面另外一個模型:霍夫曼編碼。

如果我們可以把較短的編碼分配給高頻出現的詞彙,把較長的編碼分配給低頻出現的詞彙,這樣編碼效率最高。

比如電報的摩爾斯密碼,是由點和線兩種符号組成,他将最簡單的代碼,分配給了最高配的字幕。

對信息進行數據分析(信息論模型合理配置資源)4

由此可見,為了提高效率,我們應該把生活中最重要的資源,分配給人生中最高配出現的場景

與之類似的有一個廣為人知的概念--奧卡姆剃刀:無需必要,勿增實體。結合起來,得出一個結論,即大刀闊斧地做減法,圍繞關鍵領域飽和配置資源。其實很多IT人員就是這樣,熟知的标配都是黑色背包和格子衫,他們不會在衣服上花精力和資源,但是其經常使用的電腦和手機等電子産品,往往都是買的最好的。

幀間壓縮算法

視頻需要壓縮才能方便傳輸,如果一個高清電影,不壓縮的話,大概占據空間為11198GB。這種處理方式即是幀間壓縮算法,它包含着一種哲理,通過關注信息增量,而不是關注信息存量,來極大地提升效率。

對信息進行數據分析(信息論模型合理配置資源)5

如上圖,每個格子代表一幀,觀察會發現,裡面存在很多重複信息,隻有右手在變化,其他完全一樣。所以,隻需要對第一個圖整體處理,後面的隻關注右手的變化即可。

所以,如果我們關注變化,忽略重複,可以使我們的學習效率提升N倍。

有的人一年可以讀上百本書,怎麼做到的呢?他們的關鍵原則基本是,不平均用力。讀越基礎,越深刻,越偏理論的書,花的時間越大,讀表層膚淺的書花的時間就越少。這其實就是霍夫曼編碼的原理,因為基礎的知識,在很多不同的書裡面都會存在,是高頻場景,需要配置大量資源。因此,提高讀書效率,隻需要,集中精力夯實基礎知識,然後隻關注新知識的增量。

比如,如果你對閱讀過,腦科學——高效學習的秘密,對大腦的功能分區有一個完整的知識框架,你會發現,對其他書籍裡面,相關的章節你閱讀速度會非常快,而其他人,可能這個部分是最難讀的。

其實生活中,做任何事情,起步的時候先花時間把基本練紮實是最重要的,因為基本功越紮實,後面不斷前進,就可以隻關注增量。

互信息

兩件事情的互信息越大,表面他們之間的相關性越強。需要注意的是,相關性不等于因果性。

人類的本能會去尋求因果,但是在這個世界上,大部分事物之間的聯系都是相關聯系,比如一些短視頻平台推送視頻,都是會給客戶打個性化标簽,比如寶媽,學生黨等,這些标簽就是互信息,不能說你打開了一個軍事視頻,就說明你是一個軍事迷。

很多成功人士在分享經驗的時候,也都混淆了相關和因果。很多人說,當年之所以做這個事情,是因為我覺得XXXX。這個說法通常都是錯的,因為生活錯綜複雜,記憶卻是主觀的,這個在文章認知心理學--高效學習中有講過。再加上,當人類要向其他人表達的時候,會自發地美化自己。

比如過去三十年,很多成功企業家說自己能成功,都是自己有魄力有能力有毅力,但這隻是相關關系,不是因果關系。他們發展是趕上了中國本身整體的高發展紅利。

信息等價、冗餘度

高互信息的一個極端情況,就是信息等價。知道了A事件發生的信息,就等于知道了B事件。很多演講之所以讓人覺得無趣,就是因為有很多信息等價,給人一種廢話連篇的感覺,比如,今天天氣真好,風和日麗,陽光明媚。

冗餘度,如果廢話多,那就是添加了很多冗餘度。冗餘度在計算機和工程學裡面也會出現。簡單的可以解釋為,資源的重複度。計算機裡面,就是增加備份來保證系統更加安全可靠的工作。

所以冗餘度并不是一個貶義詞,如果冗餘度非常低,其實也增加了信息被接受的難度。

當代年輕人,從出生就接受了大量的信息,所以相比上一代,對冗餘度的接受越來越低,所以會出現YYDS等精簡詞彙出現。那如何有效地去除冗餘度呢?--畫分析框架。

腦圖是一種偷懶的分析框架,它默認結構知識金字塔結構,但語言表達結構多種多樣,比如遞進,循環,四象限等。

一般畫腦圖分為三步:

  1. 先把關鍵概念零散地列出來
  2. 尋找概念之間的關聯,進行分類和鍊接,拿到信息等價的概念
  3. 回憶腦中已經建立的思維模型,進行套用和矯正,形成一個屬于這一次閱讀内容的新的分析框架

本篇文章主要介紹信息論相關的模型,并通過介紹證件壓縮算法和霍夫曼編碼的原理,引申出提高讀書效率,隻需要,集中精力夯實基礎知識,然後隻關注新知識的增量。生活中,做任何事情,起步的時候先花時間把基本練紮實是最重要的,因為基本功越紮實,後面不斷前進,就可以隻關注增量。并通過去除冗餘度的原理,介紹了畫腦圖的方法。

下一篇《營銷學重要模型》,不見不散。

,

更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!

查看全部

相关生活资讯推荐

热门生活资讯推荐

网友关注

Copyright 2023-2025 - www.tftnews.com All Rights Reserved