tft每日頭條

 > 科技

 > 數據清洗的策略

數據清洗的策略

科技 更新时间:2024-10-05 19:55:34

數據清洗的策略(公司深度Snowflake領先雲上數據倉庫)1

矽谷雲計算服務公司Snowflake(股票代碼為:“Snow”)9.17日在美國紐交所上市,發行價為120美元,截止目前股價226.74美元,市值達627億美元,Snowflake獲得巴菲特旗下伯克希爾哈撒韋公司及軟件巨頭Salesforce加持,兩家各投2.5億美元。巴菲特極少參與新股認購,也很少下注 SaaS 公司,今天一起來了解下這家巴菲特看中這家公司。

一、公司概況

Snowflake成立于2012年,由三位數據倉庫專家Benoit Dageville,Thierry Cruanes和Marcin Zukowski共同成立。其中Dageville和Cruanes是甲骨 文公司的前數據架構師。

公司的主營業務是數據倉庫。數據倉庫是一項發展曆程漫長的技術,其概念确立于上世紀90年代初,定位是為企業信息化建設過程中“煙囪式” 數據治理困境提供治理能力,建設面向主題的、跨系統集成的分析型數據庫,并最終服務于企業的業務決策。在過去三十年間,企業對數據倉庫 的整體定位沒有發生根本的改變,即為企業提供業務決策支持。

數據倉庫經過一代又一代的升級,随着企業數字化深入推進,企業對雲的應用程度也越來越深,對數據倉庫的需求進一步發生了變化,推動了第 四代數據倉庫——以Snowflake為代表的“雲原生數據倉庫”的崛起。

數據清洗的策略(公司深度Snowflake領先雲上數據倉庫)2

存儲層,完成三大全球最重要的公有雲平台架構接入,實現跨雲數據傳 輸:在2014年,Snowflake雲原生架構完成在Amaon S3平台的搭建;在 2018年,完成在Microsoft Azure平台上的搭建;2019年完成在Google Cloud Platform上的搭建,現已經完成在多個公有雲平台上搭建,實現 跨雲的數據傳輸;

集中化的數據倉儲系,支持多節點計算,計算存儲相分離:公司建立了 “中央數據存儲系統”,支持多節點計算,客戶在公司提供的數據庫上 根據不同的需求取用相關數據,避免了數據的浪費,實現按需取用,按 量付費;

數據大腦支持不同場景的應用服務,單日可承載上億次數據請求:公司 的數據雲服務是公司數據架構的延伸,對不同場景的數據進一步深加工, 起到“數據大腦”的功能,幫助客戶實現客戶端管理、交易、規劃、客 戶治理服務等,目前公司最大單日可承載上億次數據請求。

數據清洗的策略(公司深度Snowflake領先雲上數據倉庫)3

根據Forrester’s Total Economic Impact 研究顯示,四家客戶使用Snowflake3年累計創造的價值超過2100萬美金,折合612%ROI;Snowflake 能夠大量縮短計算時間、提高利潤、根據數據提供更好的決策支持、嚴格按照使用量計費、大量節約了客戶的費用支出;

“相較于市場上其它領先的數據庫服務方案,在相同情況下,Snowflake能夠幫助客戶節約更多的成本”——Michael Bigby ,CTO;  Snowflake目前管理數據超過260PB,在全球擁有1300多個合作夥伴。

數據清洗的策略(公司深度Snowflake領先雲上數據倉庫)4

二、公司優勢

一站式數據解決平台:公司針對現在不同公司、不同行業的數據庫之間存在的孤島現象,提供了一站式的數據平台解決方案,通過設置 數據引擎、數據湖、數據倉庫等功能,使得分散化、碎邊化的數據能夠相互聯結彙總,并且打破了數據之間的相互隔離現象。

提供個性化的行業服務解決方案:公司目前針對醫療、教育、市政、金融、廣告媒體、零售等行業的特點提供了個性化的解決方案。

數據清洗的策略(公司深度Snowflake領先雲上數據倉庫)5

數據清洗的策略(公司深度Snowflake領先雲上數據倉庫)6

Snowflake是做可以加強雲性能的數據平台起家的,但是Snowflake并未止步于此,經過近十年的發展,Snowflake已經成為可以為上千家客戶探 索、分享和解鎖數據真正價值的雲數據服務商。

在Snowflake發展過程中,它利用了當今企業技術上的兩個最大趨勢:大數據處理和公共雲。它的核心産品是基于雲的數據倉庫,該倉庫可在三 個主要的公共雲之間無縫運行,與最初設計用于内部部署數據中心的舊數據倉庫形成了鮮明對比。公司從最初的産品拓展到現在,提供了統一的 大數據查詢,治理和服務套件。

數據清洗的策略(公司深度Snowflake領先雲上數據倉庫)7

三、客戶分析

Snowflake的客戶快速增長,從2019年7月31日的1547個客戶,增加到2020年1月31日的3117家客戶,主要為中型和大型客戶,平均每位客戶年 消費為11.1萬美元;

這些客戶中,有7家“财富”10強和146家“财富”500強,在截至2020年7月31日的六個月内分别貢獻了約4%和26%的收入,其中還包括Capital One和Adobe等知名公司;

截至2019年和2020年7月31日,在過去12個月産品收入中貢獻超過100萬美金的客戶數量分别從22個增加到56個,Snowflake在大客戶中的認可 度很高且在不斷提升。

數據清洗的策略(公司深度Snowflake領先雲上數據倉庫)8

公司的銷售模式包括直銷、通過網站進行的自助免費試用以及合作夥伴分成。直銷團隊由面向大客戶的銷售團隊和面向小客戶及現有客戶的内部 銷售團隊組成。公司大部分收入是通過直接銷售獲得的。

數據清洗的策略(公司深度Snowflake領先雲上數據倉庫)9

四、管理團隊

數據清洗的策略(公司深度Snowflake領先雲上數據倉庫)10

五、營收分析

從收入端來看,公司營業收入高速增長,規模接近翻倍,2020财年(20190131-20200131),公司營業收入2.65億美金,同比增長174%;2021上半财年(20200131- 20200731),公司營業收入1.33億美金,同比增長133%,公司季均環比增速22%,整體保持穩健平滑增長;

從構成來看,公司産品相關收入占比較高,服務收入比例逐步提升:2020财年,公司産品相關收入2.52億美金,占比95.26%,服務相關收入0.13億美金,占比 4.74%, 2021上半财年,産品相關收入2.27億美金,占比94%;服務相關收入0.15億美金,占比約6%。服務及其他相關業務收入占比逐漸提升。

數據清洗的策略(公司深度Snowflake領先雲上數據倉庫)11

六、市場規模

公有雲市場總量将繼續維持高速增長:根據Gartner最新披露,2019年全球 公有雲市場總規模2427億美金,同比增長30%,将繼續維持高速增長,預 計2022年總規模将超過3600億美金,年均複合增長率超過14%。

SaaS占據主要市場份額:SaaS(軟件服務)自2015年經曆爆發式增長, 截至2019年末總規模超1020億美金,占全球公有雲市場總規模超過42%。

DaaS步入高速發展期:DaaS(數據即服務)主要是指通過資源的集中化管理, 幫助實現高效的企業級數據分析,目前是雲計算領域增長最快的子行業,2019年 末,總規模6.16億美金,預計2022年總規模将超過25億美金,對應年化複合增速 60%。

數據清洗的策略(公司深度Snowflake領先雲上數據倉庫)12

數據量保持高速增長:随着物聯網、雲計算等行業的蓬勃發展,對 數據的存儲、交換、計算等的應用需求不斷增加。據IDC統計, 2019年,全球産生的數據量為41ZB,過去十年的CAGR接近 50%,預計到2025年全球數據量或高達175ZB,2019-2025年仍将 維持近30%的複合增速。

數據服務面臨主要痛點:目前由于不同用戶之間建立的數據庫 相對獨立,彼此之間不能及時有效數據共享,數據孤島現象普 遍存在,造成了大量的重複計算,客戶獲取和使用數據的成本 較高。

數據清洗的策略(公司深度Snowflake領先雲上數據倉庫)13

七、競争格局

基礎服務端市場競争格局固化:全球公有雲市場發展的雛形形成 于2006年,發展初期以IaaS(基礎設施服務)和PaaS(平台服 務)為主,由于IaaS PaaS較高的投入和較大的規模效應,目前 已形成了亞馬遜、微軟、谷歌等巨頭壟斷的競争格局。

應用端市場百花齊放: SaaS(軟件服務)因其直接面向客戶 端,具有較強的差異化特點,目前競争相對多元化,前5大巨 頭占比不到30%,不同行業SaaS供應商百花齊放。

數據清洗的策略(公司深度Snowflake領先雲上數據倉庫)14

八、業務分析

北美地區占主要收入,國際市場蘊含巨大增長空間:目前,公司總收入88%來自于美國,随着全球雲計算市場的高速發展,公司已經在歐洲、亞洲 等地區進行了銷售和客戶服務的部署,公司将進一步擴大全球業務版圖,未來業務發展增長空間巨大;

建立更廣闊的數據分享體系:公司目前通過吸引更多客服、合作夥伴和數據提供者的加入,建立更加龐大的數據分享平台,提高客戶對數據分享這 一創新的商業模式的認知度。

數據清洗的策略(公司深度Snowflake領先雲上數據倉庫)15

毛利潤基本維持在60%以上:2020财年,公司毛利潤1.48億美金, 毛利率56%,2021上半财年,公司毛利潤1.5億美金,毛利率 62%。目前,公司整體毛利率維持在60%以上水平。

公司主要以雲數據平台和數據雲為支持,提供彈性的服務,具有較 強的規模化效應,邊際成本較低,随着業務的發展毛利率具有持續 增長空間。

淨利率負債有所縮窄:目前公司正處于高速成長和市場擴張階 段,費用端開支較大,2020财年,銷售費用2.94億美金,研發費 用1.05億美金,管理費用1.08億美金,公司淨利潤為-3.48億美 金,淨利率為-132%。2021上半财年,淨利潤-1.71億美金,淨利率-71%,虧損有所收窄。

數據清洗的策略(公司深度Snowflake領先雲上數據倉庫)16

毛利潤低于可比公司,盈利仍有提升空間:Snowflake目前仍在高速增長階 段(毛利率60%),毛利率遠低于同行業可比公司(平均水平70%),毛利 率仍有較大的提升空間。

數據清洗的策略(公司深度Snowflake領先雲上數據倉庫)17

MONGODB成立于2007年11月,是一款為web應用程序和互 聯網基礎設施設計的數據庫管理系統,具有領先的現代化通用 數據庫平台,能夠滿足性能,可擴展性,靈活性和可靠性方面 的需求,實現在公有雲、私有雲、混合雲端部署,目前公司毛 利率基本維持在70%左右。

ALTERYX成立于1997年,是自助服務數據分析軟件領先供應 商,公司基于訂閱平台允許企業輕松準備,融合和分析來自衆 多來源的數據,并更快做出數據驅動決策,目前公司毛利率基 本維持在90%左右水平。

Snowflake過去12個月營業收入增速138%,在美股科技股中處于領先水平,高于美國熱門科技股Zoom(111%)、Shopify(60%),顯著 高于美股熱門科技股平均增長率水平(72%);

Snowflake淨客戶留存率達158%,高于Zoom(130%)、Datadog(130%)等美國科技公司,說明公司具有極高的客戶忠誠度。

數據清洗的策略(公司深度Snowflake領先雲上數據倉庫)18

九、公司估值

Snowflake為典型科技股,主要采取PS法進行估值,按2021财年收入(20200131-20210131)6億美金來算,本财年PS估值為110倍;  以150%的财年收入增速來看公司,下一财年公司PS估值為44倍;

以200%的财年收入增速來看公司,下一财年公司PS估值為37倍。

Snowflake的成立至今,先後獲得小山風險投資公司(Sutter Hill Ventures)、紅點投資(Redpoint Ventures)、Wing ventures、Altimeter Capital、Madrona Venture Group、Iconiq Capital、Sequotia Capital、Meritech Capital Partners、Dragoneer Investment Group(DIG)和 Salesforce Ventures共計13.53億美金的融資。

或許是因為抓住了企業上雲的市場需求,這也讓Snowflake融資規模越來越大。從2012年到2020年這八年的時間裡,Snowflake融資規模也是水漲 船高。目前為止,Snowflake融資規模較大的是最近的三輪,分别是2018年1月的2.63億美金(E輪),2019年7月的4.5億美金(F輪),以及2020 年2月的4.79億美金。

數據清洗的策略(公司深度Snowflake領先雲上數據倉庫)19

Snowflake于今年9月16日正式于紐交所上市,首發價格120美金,發行2800萬份,(最多額外認購420萬份),上市前首發股價由85美元上調 至110美元,最終發行價格定位120美元;

Salesforce投資機構、巴菲特在一級市場分别認購2.5億美金:公司與Salesforce和Berkshire Hathaway達成協議,按照二級市場首發價格,各 于一級市場購買2.5億美金股票,占比約5.8%;

公司上市首日股價由120美金一路飙升,收盤報價$255.93,首日漲幅112%,市值達到708億美元,次日股價下跌近10%,波動較大。

十、小結

Snowflake所處雲計算行業受到市場廣泛關注:目前資本市場對Snowflake的關注,是資本市場對雲計算市場極度看好的标志(特别是雲應用 市場),公司所處的雲計算行業發展前景廣闊,預計2022年全球公有雲市場總規模将超過3600億美金,對應年均複合增長率超過14% ,數據 的瘋狂增長( 預計全球數據量将保持30%的複合增速)和多雲部署的的趨勢是推動力公司估值持續增長的源動力;

巴菲特加持,使公司進一步聚焦于鎂光燈下:Snowflake上市前首發價格曾多次上調,由85美金上漲至120美金,巴菲特的效應不可或缺,如 果沒有巴菲特加持(過去50多年都沒有參與新股發售),這家公司目前不可能獲得如此多的鎂光燈;

Snowflake 的主要優勢:1)從發展戰略上看,Snowflake作為一家獨立的數據倉庫供應商不和三家雲廠商綁定結盟,充分自由的選擇權也讓 它獲得了如中國的互聯網廠商滴滴不站隊的優勢;2)從技術架構上看,公司以數據平台為接入點,主要向客戶提供數據平台和進一步個性化 的行業解決方案,能夠有效幫助客戶解決數據孤島治理問題,現已在全球22個地區部署的三個主要公共雲上可用;3)從盈利模式上看,公司 充分利用了公有雲的彈性,能夠幫助客戶以較低成本取得較高價值,并按數據取用量收取費用,公司營業收入增長潛力巨大,具有較強的規模 效應,毛利率具有進一步提升空間;

Snowflake 主要風險和不确定性來自:1)公司主要通過亞馬遜、微軟、谷歌等雲計算廠商實現數據的接入,既是客戶也是對手,公司技術及 模式未來面臨各種新的可能的競争;2)疫情等因素拖累雲計算設施服務交付,行業發展不及預期;3)市場對創新商業模式的接受程度;

Snowflake收入及盈利情況: 2020财年,公司營業收入2.65億美金,同比增長174%,毛利潤1.48億美金,毛利率56%,淨利潤-3.48億美金,淨利率-132% ;

2019财年,公司營業收入0.97億美金,毛利潤0.45億美金,毛利率46%,淨利潤-1.78億美金,淨利率-184%。

Snowflake估值:主要采取PS法進行估值,按2021财年收入(20200131-20210131)6億美金來算,本财年估值為110倍,以150%的财年收 入增速來看,下一财年公司PS估值為44倍,以200%的财年收入增速來看,下一财年公司PS估值為37倍。至今,"No Two Snowflakes the Same" Likely True。

ROI是企業選擇Snowflake的核心因素,公司近三年累計為客戶創造回報612%,客戶淨留存率高達158%,“Snowflake came in better on price compared to the industry leading solution, at comparable performance”——Michael Bigby ,CTO

,

更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!

查看全部

相关科技资讯推荐

热门科技资讯推荐

网友关注

Copyright 2023-2024 - www.tftnews.com All Rights Reserved