ai公衆号摳圖-tft每日頭條

ai公衆号摳圖

科技更新时间:2026-03-09 16:43:12

雷剛發自凹非寺

量子位出品 | 公衆号 QbitAI

千圖易讀，一video難讀。

或許你多少有些了解，在以深度學習為核心的AI算法大殺四方，機器在理解圖像、語音等方面都取得了很大的進步時，理解視頻内容仍還是一件很困難的事情。

挑戰無非三方面：

首先，信息量大，不是簡單的詞語就能概括視頻的内容。

一圖勝千言，僅一張圖片就包含大量信息，難以用幾個詞來描述，更何況是短視頻這種富媒體形态。

其次，維度多，視頻是視覺聽覺多模态信息融合載體。

多模态深度語義理解能讓機器更深地理解短視頻背後的含義，然而也面臨着很多挑戰，例如圖像像素如何與語音波形或聲譜圖産生相關性。

最後，業内始終缺乏大規模的數據集。

更大、更具挑戰性的數據集，必然會對學術界和工業界研究和實踐方向的推動起着重大作用，如圖像分類裡的ImageNet，目标檢測裡的COCO，而對于短視頻，一直沒有大規模的數據集。
用戶興趣建模
顧名思義，該比賽圍繞用戶興趣進行建模，核心是充分挖掘AI理解的視頻内容來挖掘用戶興趣數據，使得推薦給用戶的視頻更加精準，最終以AUC得分高者勝。

作為主辦方，快手提供了一批脫敏之後的用戶點擊、點贊和關注等交互行為數據，同時提供這批作品封面的視覺特征、人臉特征和文字描述特征，這些數據特征共計3w 用戶、920w 視頻，以及6000w 行為數據。

而且為了激發更多參賽者，快手還特地設置了30w 獎金池。3人結隊，為期3個月，分為初賽和複賽，最後取前10名嘉獎，一等獎20萬元，二等獎5萬，三等獎3萬，另外還有2個極客獎1萬元和5個優勝獎各3千元，總獎金池高達31.5萬元。

此外，複試排名的前30，還能在畢業前随時直通快手面試。

聽起來就一顆賽艇。

△ 本次大賽提供的訓練數據

具體任務中，選手要通過一個視頻及用戶交互行為數據集對用戶興趣進行建模，然後預測用戶在另一視頻數據集上的點擊行為。

值得注意的是，這兩個數據集的視頻ID交集為空。

這使得本次大賽和以往大多數用戶興趣建模大賽有很大的區别，選手必須充分利用AI算法提供的視頻理解結果，對視頻内容進行提煉，從而建立兩個數據集的關聯點。

無論在學術界，還是工業界，這都是一個難且新的問題。

内容理解在快手
不過，這樣的問題在快手其實每天都在得到訓練和解決。

現在整個快手平台，已經累計擁有超過50億條視頻，日活躍用戶超過1.2億，其核心産品邏輯是視頻内容的個性化推薦。

一方面，這需要機器對内容的理解足夠極緻，從多種維度、綜合利用多種技術對短視頻進行分析理解，再把理解應用到推薦模型中去。

另一方面，内容安全是懸在每家互聯網公司頭上的達摩克裡斯之劍，在非法違規内容監測上，機器對内容的理解将大大減少審核所需的人力，原創視頻的保護亦然。視頻搜索、商業化也需要機器對視頻的深度理解。

而上述原因，也是為什麼快手願意花費人力、拿出數據、重金激賞參賽項目的核心原因。
快手之腦
在快手内部，用AI來理解視頻的團隊叫做多媒體内容理解部門（Multimedia Understanding），簡稱MMU ，這個團隊正在試圖打造“快手之腦”。

該部門負責人李岩，也在此次比賽中，分享了部門技術建設的核心思路。

理解視頻之所以難，是因為目前AI展示的諸多能力，還停留在圖像、語音等感知層面，然而視頻則是二者的疊加，所謂多模态，在此體現得最為充分，而AI在這個領域才剛剛開始起步。

此外，對高層語義的識别理解也是AI亟待解決的問題。

而解決思路方面，李岩認為，視頻内容理解從大方面分為感知和推理兩個階段。

感知階段，快手目前主要從四個維度分析理解視頻内容，分别是人臉、圖像、語音，和音樂。

其中，人臉信息在社交視頻中占據重要地位，需要對視頻中的人臉進行檢測、跟蹤、識别，并分析出視頻中人物的年齡、性别等屬性，挖掘其中的3D形狀、表情等信息。

圖像維度，通過分類、物體檢測等算法分析場景、物體，通過圖像質量分析算法對圖像的主觀質量進行評估，通過 OCR 分析圖像中包含的文字信息等。

語音方面，不僅要識别語音，還要識别說話人，對說話人的情緒、年齡等語音屬性進行信息分析。

音樂方面，則要進行音樂識别、歌聲、伴奏分離、歌聲美化打分等分析任務，對音樂信息進行結構化。

基于以上四個維度，來完成對視頻低級語義信息的感知。

在完成上述任務後，機器才進入到推理階段。機器需要基于感知階段的輸出，将視頻看做一個整體，進行分類、描述、檢索。

此外，像人将學到的知識存到大腦一樣，令機器把視頻内容整理并存儲到知識圖譜中，也是目前快手的主要做法，這樣融合感知内容和知識圖譜，使得理解視頻高層語義及情感成為可能。

值得一提的是，為了實現對視頻内容的理解，還有一大攔路虎要克服。
挑戰和未來
非常直接而現實的是，當前AI技術還處于嚴重依賴人工标注的階段。

這需要人類坐在電腦前，一個個畫框打标簽，以幫助機器更好地理解。該做法不僅成本高，效率低，而且對标注員而言非常枯燥。未來減少人類标注，或者讓機器能夠更智能地去理解新内容，是AI算法進化的核心方向之一。

這也是快手發起此次用戶興趣建模大賽的核心原因之一，希望培養、吸引更多年輕力量，加入到這場AI未來變革的先鋒部隊之中。

在過去幾年中，快手的多媒體内容理解團隊擁有近百名資深算法研究員和研發工程師，大部分研發人員具有多年 BAT 工作經曆，核心算法研究員擁有超過十年的研發經驗。

也有清華、中科院、港科大、南京大學、上交、京都大學等國内外高校學生加入快手，實現産學研一體，打造了人才梯隊培養的機制。

但李岩強調，一切還遠遠不夠。

快手還希望找到更多有志于計算機視覺、語音識别、視頻内容理解、人臉識别&3D重建等相關領域的人才。

李岩相信，快手目前擁有的數據資源，以及正在嘗試的攻堅，都會是吸引人才的重要砝碼。

One more thing
最後，也附上本次興趣建模大賽的答辯幹貨。

這次比賽Top10的答辯選手解決方案，一句話總結：一個框架、兩類思路。

一個框架

這裡說的框架并不是算法框架，而是在處理這類問題時的通⽤代碼。這個框架能夠使算法在處理不同數據時能夠簡單快速地完成驗證。

框架設計的整體思路就是特征群分離，并且不同數據類型進⾏分離。特征群分離主要指的是不同的數據來源。

提取的特征進行分類，例如用戶行為特征群、視覺特征群等。每個特征群又可以分為連續特征或者離散特征，例如視覺特征群可以包括連續的降維特征以及離散的視頻聚類特征等。

這樣做有三點好處:
對于新發現的特征可以快速知道适用于哪一側的模型，方便特征擴容。
特征群分開，可以快速定位哪些特征對線上效果增益最大。代碼與特征分離，框架一次開發，後期添加特征的成本大大降低。

下圖為一個典型的框架設計圖：

總體來看，比賽的特征分為：原始特征、Embedding特征，⼿⼯特征。這些特征又可以分成連續特征和離散特征。所以一個好的框架，在設計之初就可以充分考慮到這些數據，從而在後期對這些特征進行很好的擴容。

大部分選手針對大賽提供的數據把特征分成了了若幹個特征群，每個特征群對應一大類數據的輸入，然後分别針對每個特征群進行特征提取。

在框架設計的時候，會把特征按照不同的類别進行劃分。這樣做可以盡可能複⽤代碼框架。

兩大類思路

選手的思路大緻可以分為兩大類，⼀個是以特征工程加模型調參為代表的傳統機器學習算法。

另⼀類是以模型構造加注意力機制的深度學習算法。

特征工程主要是以第一名為代表的伏地魔團隊，模型主要是第二、三名團隊。

當然這兩種算法在具體的實現過程中存在一定的交叉，但是不同的實現都有所側重。

△第一名“ 伏地魔團隊”的特征工程

△ 第二、三名的網絡結構

總體來說，特征工程需要對數據極其敏感，而且需要對快手App本身有更深入的了解，知道用戶的使用習慣，并且對數據具有極強嗅覺。

設計模型最多的工作則是調整網絡參數，需要對模型不同層、不同網絡之間有極高的能力。深度模型可以隐式地提取數據的特征，具有很好的數據抽象能力。

當然，如果還希望了解更多相關比賽和多媒體内容理解信息，歡迎移步快手招聘公衆号。

也希望能有更多類似的數據集開放、類似的比賽舉辦，不管是為解決行業難題，還是實現人才培養，最終都能促進整個産學研向前進步。

嗯，一舉多得，值得鼓勵~

— 完 —

誠摯招聘

量子位正在招募編輯/記者，工作地點在北京中關村。期待有才氣、有熱情的同學加入我們！相關細節，請在量子位公衆号(QbitAI)對話界面，回複“招聘”兩個字。

量子位 QbitAI · 頭條号簽約作者

վ'ᴗ' ի 追蹤AI技術和産品新動态
,
更多精彩资讯请关注tft每日頭條，我们将持续为您更新最新资讯!

查看全部

网友关注

科技 mac上輸入法怎麼切換
我們日常生活中都是要使用Mac電腦時都是要不同的輸入法來幫助我們輔助完成工作或者是其他指令，那麼切換輸入法的麻煩就在此刻顯現了。如何能快速的切換輸入法，且也不會顯得操作很麻煩，可能就隻有它可以幫我們了。自動切換輸入法不僅帶有快捷鍵輸入的功能... 2022-12-26
科技回收站中恢複的文件會恢複到哪裡
電腦上的各種文件對我們工作和學習都很重要。清理文件的是很容易出現問題的，所以一般這個時候我們可以把它們放到回收站裡。我們可以把它們從回收站裡面拿出來，但是如果回收站的裡面的文件也删了怎麼辦？如何恢複回收站清空的文件，快來看看如何操作吧。回收... 2023-01-02
科技美容院預約流程标準圖
衆所周知，美容院的客戶、客流量是最重要的，随着美業競争越來越激烈，各種各樣的美容院管理系統成為了每個美容院老闆做好生意、業績增長必不可少的工具，特别是美容院預約系統，不僅解決了門店預約排班的許多麻煩，還能提升顧客消費體驗和好感，成為美業門店... 2023-02-08
科技蘋果電腦更新最新版本怎麼樣
Mac即将迎來大更新在近日著名的蘋果分析師郭明錤發布了最新的Mac系列爆料，指出下一代蘋果Mac産品将迎來巨大更新。而在之後彭博社也對這些爆料表示了正确态度，認為蘋果将會在今年下半年發布全新的Mac産品線。郭明錤曝光的準确度一直都非常高，數... 2023-02-16
科技電腦頻繁出現藍屏是什麼原因
電腦頻繁出現藍屏是什麼原因?Window電腦有時會遇到藍屏，遇到藍屏怎麼辦，我們看下提示的藍屏代碼代表的含義，這樣我們才能根據不同代碼進行應對的解決方法，以下是我收集的一些藍屏代碼，供參考，今天小編就來聊一聊關于電腦頻繁出現藍屏是什麼原因?... 2023-03-18
科技 vivo手機2022年排行
随着六月份的到來，今年手機市場的競争也即将賽程過半。與往年不同的是，今年的國内手機市場出現了一個很大的變化，經濟的不景氣與人口紅利的消退，使智能手機的出貨量處于一個下降的趨勢。這樣的情況下，如何留住老用戶就成為各大手機廠商需要思考的問題了。... 2022-12-13
科技人工智能外骨骼技術
每周三期，詳解人工智能産業解決方案，讓AI離你更近一步。解決方案均選自機器之心Pro行業數據庫。方案1：微創外科手術機器人——DaVinci解決方案簡介：達芬奇機器人的機械臂可完全模仿人手腕動作，專利的運動模式保證了醫生手部動作與機械臂運動... 2023-01-14
科技 php導入excel更改後導出
php導入excel更改後導出?這幾天要做一個數據導出的功能，數據中存在手機号或者身份證号，但是導出來的時候，都無法正常顯示，需要點下表格才能把數據顯示出來使用起來，就不非常方便總結以下正常顯示的方法，接下來我們就來聊聊關于php導入exc... 2023-02-11
科技電腦如何設置可以遠程控制
有些時候電腦出現了一些我們解決不了的問題時，這時我們一定第一時間想到就是讓電腦高手幫忙看一下問題；但要對方在異地該辦呢，那就通過電腦遠程來解決了；那麼問題又來了，電腦怎麼遠程控制他人電腦呢？小編下面就給需要的小夥伴演示一下。我們在是有電腦的... 2023-01-16
科技 6800和12500核顯筆記本推薦
對于标題，小編先賣個關子，看完我的評測，就知道為啥特殊了。。。簡單大方不花哨，我這個年齡段的人比較喜歡的風格開始開箱了看一下外觀，A面，簡單大方硬朗先給大家放幾張外觀美拍亮了。。。神船顯靈，開機成功，win10家庭版系統屏幕看着還不錯，萬能... 2023-03-26
科技手機一直在響她卻倒在了家門口
同事說她的朋友正在打着電話，打着打着她突然跟電話裡的朋友說：诶，我的電話呢？怎麼找不到呢？在哪了？正跟她通話的朋友說，你去屋子的其他地方找找看，有沒有找得到。結果她真的去找了，一邊找一邊說，床上沒有，床頭櫃沒有，櫃子沒有，地上沒有，茶幾沒有... 2023-03-21
科技電氣中标直流充電樁
電氣中标直流充電樁?挖貝網2月22日，晨泰科技（834948）近日發布公告，中國南網電網有限責任公司(或簡稱“南方電網公司”)于2023年2月22日在其陽光電子商務平台公告了“貴州電網有限責任公司（以下簡稱“貴州電網公司”）2022年第二批... 2023-03-25
科技榮耀magicbook系列發布時間
作為一名IT媒體的電腦評測編輯，我對筆記本電腦的需求相對比較明确。首先要有足夠流暢的運行速度和足夠穩定的表現；其次要有一塊色彩正、分辨率适中的屏幕，當然如果再有護眼功能就更好了；其三要便攜一些，除了上下班通勤之外，外出開會、出差都能便捷攜帶... 2022-12-06
科技人類一敗塗地手機版教程鍊接
讓無數玩家苦等的沙雕模拟遊戲《人類跌落夢境》正式确定發售日，12月17日上線TapTap和AppStore，首發優惠價12元。此次此刻，稚嫩的人類，又将記起，在損友的笑聲中瑟瑟發抖的恐懼。但是，消除恐懼的最好辦法就是面對他，學着一起傷害别人... 2023-01-17
科技多倫學車系統
多倫學車系統?多倫科技成立于1995年12月，注冊資本62709萬元，是一家為機動車駕駛技能考試培訓、城市智能交通行業提供整體解決方案及運維服務的國家高新技術企業多倫科技是中國道路交通安全協會理事單位，已參與起草國家及行業标準共11項公司依... 2023-02-07
科技新手機快充能充一晚上嗎
給手機充電是我們每天必須要做的事情，如何保護手機的電池延長壽命也是一個讨論了幾十年的問題。電池的材質和技術也在不斷的更新，新手機充電需要注意的事項也在發生着變化。那麼問題來來，超級快充越來越普及，現在給新手機充電都需要注意哪些呢？别再迷信充... 2023-02-23
科技 wps怎樣修改保存路徑
要保存WPS文檔，可以直接點擊左上角的保存鍵,文件會默認保存到C盤的用戶文件夾裡面。如果你想要将文件保存到自己熟悉的位置，那就需要更改保存路徑了。點擊左上角文件下拉框中的文件按鈕，選中另存為。在彈出的另存為對話框，可以點擊保存在的下拉框。文... 2022-11-27
科技如何自己開發一個自己的網站
一個網站能夠給該網站主人帶來很多好處，因此現在很多人都想要擁有一個屬于自己網站，不過網站建設可沒有想得那麼簡單，要是沒有一定專業知識，你可能要花很多時間才能夠建設出來一個網站。那怎麼自己做一個網站？有具體步驟嗎？其實網站建設發展到現在，門檻... 2022-11-29
科技一加手機11什麼時候上市
IT之家1月25日消息，在即将到來的2月7日的雲端活動中，一加将發布一堆産品，包括一加115G、一加BudsPro2無線耳機、旗下首款鍵盤和新的一加TV65Q2Pro。另外，一加預計也将在同一天推出一加11R5G智能手機。印度亞馬遜通過其應... 2023-03-16
科技華為p20p今天售價
本周華為P20發布了，雖然價格不算低，但3788元的起步價，讓很多人感覺還是可以接受的，畢竟Mate10現在市場價也在3700元左右，而P20在拍照方面還有很多強化。而同時，P10也跌入曆史低價，其中華為官方報價2988元起，而經銷商已經有... 2022-11-28
科技好用散粉真實測評
化完妝定妝也很重要，但是有很多散粉都很雞肋，今天給大家測評幾款網紅散粉，讓你不踩雷。悅詩風吟散粉價格便宜，粉質也算細膩，對學生黨很友好，控油效果很好，但是會假白，我個人覺得持久效果不是很好，後期需要補。旁氏散粉這個雖然便宜，但是粉質很粗糙，... 2022-11-02
科技學生宿舍蚊帳遮光床簾怎麼安裝
收到支架後，先不要把支架拆散，仔細看标簽。“寬”的是1捆，裡面10節杆子。“長”的是2捆，每捆裡面6節杆子。一捆沒字是“高”，裡面是8節（1.1米高）然後拼杆子。“寬”。寬裡面10節杆子，其中5節是兩頭粗細一樣，5節是有細頭的。區分後1對1... 2023-03-29
科技有聲書會侵權嘛
有聲書會侵權嘛?極目新聞記者張理晶通訊員姜泰陽，今天小編就來說說關于有聲書會侵權嘛?下面更多詳細答案一起來看看吧!有聲書會侵權嘛極目新聞記者張理晶通訊員姜泰陽一網絡公司未經許可，在“聽書”軟件上提供版權錄音供網友試聽下載，被告上法院。近日，... 2022-12-21
科技适合小白的裝修設計軟件
SU的第一個優點就是：上手快！這是SU打開後的界面，左側是工具欄，圖标都是簡單易懂點擊鉛筆就是畫線點擊偏移工具，輸入牆體尺寸，例如0.2米點擊推拉工具，牆體就出來啦點擊油漆桶，可以給地闆或牆體選擇材質是不是很簡單呢，還有橡皮、畫圓之類的工具... 2022-12-09
科技遊戲顯卡怎麼選
遊戲顯卡怎麼選?核心(GPU)這個好不好，看四個方面：，下面我們就來聊聊關于遊戲顯卡怎麼選?接下來我們就一起去了解一下吧!遊戲顯卡怎麼選核心(GPU)。這個好不好，看四個方面：一是架構是不是最新的，架構就好比你的房子格局，布局好的房子實用率... 2022-06-05
科技如何正确的挑選一款手機
不同的人有不同的用機需求，也正因如此，評判一款手機是否好用的标準才會是多種多樣的。而作為消費者，我們在選購手機的時候，更多還是按需求出發，着重去關注某一方面，才不會糾結而選對一款更适合自己的手機！所以今天，好物君就簡單羅列一下如何買一款真正... 2023-01-02
科技 linux筆記本熱點工具
HeliumNetwork是一個于2019年啟動，旨在建立一個由用戶社區擁有和運營的分散式無線網絡。在Web3.0、物聯網等概念的加持下，短時間給所有人帶來突破想象力的叙述價值，隻需要布置一個類似WIFI路由器一樣的熱點網關，為附近物聯網設... 2022-12-29
科技六下比例尺的應用筆記
比例尺這一知識點中，關鍵要掌握比例尺有關的公式，比例尺=圖上距離÷實際距離，圖上距離=實際距離×比例尺，實際距離=圖上距離÷比例尺。牢記這三個公式，并學會在各類題型中的靈活應用。例題精選在比例尺是1:2000000的地圖上，量得甲、乙兩地的... 2023-02-09
科技入門耳塞對比
地外黑科技大法JVC近些年基本上是一年一套新系列的節奏。前幾年是木振膜，到大約去年還是前年，XX系列成為主題，展會上展出的除了騷紅騷紫的耳機之外，還伴随着一個禦（shao）姐（fu）級二次元代言形象——你們倒是看看隔壁家的索尼子啊喂！再然後... 2023-02-11
科技舊手機回收的禁忌
舊手機回收的禁忌?來源：科技日報放在家裡占地兒賣了又怕洩露隐私，我來為大家講解一下關于舊手機回收的禁忌?跟着小編一起來看一看吧!舊手機回收的禁忌來源：科技日報放在家裡占地兒賣了又怕洩露隐私用這個方法你的舊手機可以放心送去回收本報記者謝開飛通... 2023-02-11

tft每日頭條

> 科技

> ai公衆号摳圖

ai公衆号摳圖

相关科技资讯推荐

热门科技资讯推荐

网友关注