當「風險投資」遇上「德撲」

風險投資 · 發表 2019-01-29 17:59:42

摘要：編者按：本文來自“ 真格基金 ”，作者姚方舟。36氪經授權轉載。 Better lucky than good？迷思還是真諦早期投資的世界裡，經常有人會提到這句話，“Better lucky than good （好運勝過實力）”。可以理解為永遠不要高估自己的...

編者按：本文來自“ 真格基金 ”，作者姚方舟。36氪經授權轉載。

Better lucky than good？

迷思還是真諦

早期投資的世界裡，經常有人會提到這句話，“Better lucky than good （好運勝過實力）”。

可以理解為永遠不要高估自己的判斷對早期專案最後是否能大成的影響。畢竟影響一個專案成敗的因素確實太多，而且有些極不可控。

但如果這句話被過度解讀為：即使最後的結果不盡如人意，也不代表我的判斷不夠好，而只是運氣不佳的話，就有一些甩鍋的嫌疑了。

我們來從德州撲克的視角，看一個理解這句話的例子：

這裡有一個撲克差異計算器網站http ://pokerdope.com/poker-variance-calculator /供我們來計算撲克的波動。

這裡要說明一個概念，就是 BB / 100 手牌（大盲/百手牌），這個是線上玩家比較通用的計算盈利率的方式（線下玩家一般為 BB /小時），因為不同玩家所玩的金額大小不同，金額越大往往玩家水平越高，用 BB / 100 手牌作為標準能評估玩家在當前所玩的級別的盈利水平。

如果能在 10 萬手牌以上的的樣本做到 5BB /百手牌就說明這個玩家在該級別能穩定盈利；我們取不同的盈利率並分別模擬 20 個隨機樣本來觀察其中的波動。

這個是線上玩家比較通用的計算盈利率的方式（線下玩家一般為 BB /小時）。因為是按大盲作為單位，所以忽略具體級別的影響。

一般來說能在 10 萬手牌以上的的樣本做到 5BB /百手牌盈利就說明這個玩家已經 crush （碾壓）了這個級別；

回到上面這張圖，黑色的線是數學期望，也就是假設運氣不好不壞時會得到的一根盈利曲線。假設每百手牌的盈利是 10BB，10 萬手牌的盈利就是 1 萬個大盲，例如你玩的是小大盲分別是 5 / 10 的遊戲，1 萬個大盲是 10 萬；

但因為德州撲克存在偶然性和波動；如果你的運氣逆天，那麼有可能可以跑出藍色線那樣的盈利曲線。

反過來如果你的運氣非常差，也有可能是最下面的紅線，10 萬手牌是幾乎不輸不贏，比如經常被 bad beat （爆冷門）：AA 跟 KK 翻牌前 all in，有 80%的勝率，但是每次都被髮出 K 或者其他方式擊敗。

但這是極端情況，95%的置信區間在兩根綠色的線之間，也就是能做到不錯的盈利。

藍色、黑色跟紅色的這三根線，不就跟投資中經常預測的 best / average / worst case scenario （最好/一般/最差情況）類似嗎?

再看上面這兩張圖，簡單來說，如果盈利率是 5BB / 100 手（已經是非常高的盈利率），最差的情況下是可以在 10 萬手牌輸掉接近 5000 個大盲的；

如果只有 1BB / 100 手的話，運氣特別不好的情況下能在 10 萬手牌中輸掉 8500 個大盲。

如果把樣本放到 50 萬手牌，我們會發現結果保持較高盈利率玩家的盈利趨於穩定，而在“盈虧邊緣”掙扎的玩家所面臨的潛在虧損會更大。

迴歸到風險投資，比較恰當的理解是即使你有很好的判斷力/勝率，在一定的樣本範圍內依然有可能會虧損；但從長期、大樣本來看，只要你是更好的那個玩家，一定能等到屬於你的那份收穫。

這裡有一個很重要的限制條件就是樣本數量，對應到早期投資就是我們有多少發子彈可以供我們來打，這也是職業撲克中也許是最重要的——資金管理。

很多玩家最終離場並不在於絕對牌技的高低，而在於沒有辦法控制自己的慾望，做不好資金管理，從而沒有足夠的子彈來應對波動。

所以既不要高估早期投資中對單個專案成敗判斷的重要性，也不要去盲信大力出奇跡的廣撒網，鎖定你的投資策略並且知道其優勢（win rate），並且儘可能多的出手，用足夠支撐波動的樣本量來實現長期預期的回報。

那麼下一個問題是，如何尋找屬於你的 edge （優勢壁壘）？

尋找 Edge，博弈論最優

GTO or 剝削式打法？

關注德州撲克的夥伴可能瞭解過這兩個概念，它們可以說是德州撲克玩家想要尋求盈利所改進打法的兩種思路。

以下會分別簡單進行介紹，並且思考其在早期投資中的對映。

1）博弈論最優（Game Theory Optimal 簡稱 GTO）

2017 年 CMU 的 Libratus 機器人（開復老師也曾引入到中國，名為冷撲大師，橫掃國內頂尖玩家）以明顯的優勢擊敗了人類頂尖的單挑牌手。

繼圍棋之後，德撲這個人類對 AI 的最後防線宣告被打破，最新alphastar也擊敗了人類星際爭霸玩家（筆者注：德撲跟星際爭霸都是不完美資訊遊戲，區域性不存在絕對的最優策略，需要根據對手的行為動態調整；另，Libratus 進行的遊戲是 1 對 1 的單挑，多人遊戲的複雜程度更高，特此做個解釋）。

Libratus 採用的理論基礎也就是在每一輪下注中尋找納什均衡的打法，也就是 GTO 打法。

如果你自己嚴格按照納什均衡打法進行遊戲，其他玩家不能通過調整自己的策略來增加與你對抗的數學期望，且只要偏離了最優均衡打法就會處於劣勢。

典型的案例就是在剪刀石頭布遊戲中，以各 1 / 3 的概率出剪刀、石頭、布就是 GTO 策略，對方沒有辦法通過調整策略來獲取更大的盈利率，對方如果背離這個策略就會損失期望值。

下圖是一個簡化情況的德撲遊戲用現在比較通用的 GTO 輔助軟體 Piosolver 進行模擬後給出的策略。（詳細介紹 Libratus 以及 GTO 需要太長的篇幅，在此不再多言，感興趣的夥伴可以找我溝通討論）

用比較直白的話來說，GTO 的策略有點像金庸老爺子在倚天屠龍記中九陽真經的口訣：“他強由他強,清風拂山崗；他橫由他橫,明月照大江”

——即不管對手以及牌局如何變動，堅持自己的一套理論以及打法，沒有必要去做特別的針對性調整。

在早期投資當中確實是有這樣不變的原則的：比如 double down （雙倍下注），重注投資我們認為最優秀的團隊；

從進真格的第一天，就非常清晰地記得徐老師提出的投最好的人才以及團隊。即使現在的方向不一定是最合適的，但是隻要他們足夠smart （聰明）和hungry （渴望），之後會找到合適的方向並且進行轉型。

事實也證明如此，典型的代表是享物說的創始人孫碩以及小紅書的創始人毛文超，他們也都是經歷了不同的轉型之後才找到方向。

對於優秀人才的發掘以及長期的支援，是真格持之以恆的投資方法論也是我們不變的原則。

2）剝削式打法（Exploitative play）

在德撲中，如果桌上有一位玩家每次在翻牌圈有成牌就下注，而沒成牌就會過牌並且在別人下注時選擇放棄，那麼坐在他後位的玩家就可以利用這一點：

當自己沒牌而對手下注時選擇棄牌，而當前位玩家過牌時，不論手中有什麼牌都應該下注 bluff （虛張聲勢）拿下底池，這其實就是剝削式打法的一個核心思路。

跟 GTO 的思路出發點不同，剝削式的打法核心就是觀察並找到對手的漏洞加以攻擊，以獲取更高的盈利率；如果你找到了那個永遠只會出剪刀的機器貓，那麼就不應該繼續以 1 / 3 的概率來出了，而應該每次都出石頭；

由於市場以及創業的環境不斷在變化，必然要求我們也不斷的更新迭代打法，做出一些“剝削式”的下注或者棄牌。

還是以投人的方法論來作為例子，之前提到重壓我們認為最優秀的團隊是投資的基石原則，但是最優秀團隊的定義跟人才的出處不斷在變化。

借用合夥人雨森在投資團隊中分享的觀點，一個領域變得成熟之後，做到同樣成就對企業家的要求就會提高，應該始終去看創始人是不是同齡人/同行業人裡面的 top tier （頂級梯隊）。

在移動網際網路紅利的末期，很多行業都在收斂的情況下，模式創新異常艱難，很多公司所做的事拼的是團隊的執行能力以及運營能力。

這種情況下，曾經見過大錢，管過大隊，打過大仗的大企業高管或者連續創業者在類似的專案中也許有更大的機率能取得成功。

因此投資機構的投資渠道也會更多往高管的方向來傾斜，這本質上就是一種隨機應變的“剝削式”投資。

此外，在必要的時候也需要根據環境的變化做一些剝削式的棄牌。

在德撲中當你選擇是否跟注去聽牌的時候，往往會計算賠率，看當前的賠率是否支援你的跟注。

賠率包括當前的實際賠率，比如你要跟 100，而跟注後的底池是 300，那麼你需要 33%的概率能聽到牌；

以及隱含賠率，也就是當你聽到了牌之後如果選擇下注，對方有可能會拿著比你小的牌跟注，從而獲取比現有底池更大的回報；

如果賠率不支援，那麼長期來看這個跟注就是負 EV （數學期望上來看）；

類比而言，當市場環境變差的時候，如果部分基金的募資發生了困難，而賬上有錢的基金都選擇性地收緊了投資決策且交割放慢的情況下，早期天使輪投資的隱含賠率其實是降低的。

具體情況就是很多需要重前期研發投入，或者模式需要燒錢起量的專案，都有可能在需要續命的時候難以拿到下一輪的融資。

這種情況下天使投資可能需要進行一些痛苦的決策，傾向性地放棄一些上述模式的公司，如果要投也是選擇最有成長可能性以及回報的天花板最高的那些公司。

這裡有一個有趣的問題以及博弈是，如果天使基金開始投資一些偏向現金流以及求穩的專案，是否失去了天使投資的本質；

以及如果其他家的天使基金有上述的傾向，那麼對於高風險高回報專案，其實有更好的機會在面臨更小競爭的情況下以更好的價格進行投資，從而一定程度上也出現了更好的賠率。

我認為在具體構建投資策略的過程中，一定是需要從 GTO 出發，意即根據自身的價值觀跟稟賦設立投資的基石原則；再根據市場環境，動態的調整策略以應對變化，以期達到最大化的收益。

消除漏洞的方法論

理性分析還是感性歸納？

不管是哪一種方法論，前提都是有足夠的樣本量來支撐。天使投資的一個特點就在於有足夠大的樣本量，因而有足夠的數量供投資機構覆盤並且嘗試優化投資策略。

以下試圖舉一些不一定最恰當的小例子，從德撲的視角看一些我們平時實際決策中在感性上糾結的點。

*筆者注：以下所有資料來自我之前在 hand2note 軟體記錄的 5w 手現金局牌例，最終的盈利率是 5BB / 100 手牌。

1）拿著小對子，感覺賠率合適要不要玩？

直觀的結果是，當我在中間的位置（往往是有選手加註，我選擇跟注，同時後面面臨其他選手的跟注），在這 400 多手牌裡我的數學期望是非常差的。

原因在於當我們在中間位置加註的時候，其實後面還有很多玩家跟注或者加註，如果跟注的話在多人底池只要我們沒有擊中三條，大概率只能放棄（而三條的在翻牌面的擊中概率大約是 12%，8 次能中一次），而且翻牌前很可能被再加註從而迫使只能棄牌。

感性的認知就像是一個早期的專案，有的時候並不能達到內心的 convivtion bet（信任下注，即選擇相信自己的推斷而決策投入）的標準。但是如果有其他基金的出價或者擠壓，很多時候往往推動了機構對於專案的參與性投資，但其實這樣的專案通常不是表現最好的。

2）有 A、K 高張就是好牌嗎？

當拿著一張高牌跟一張底牌且不同花的時候，遊戲這些牌的結果如何？可以看到直觀的結果是，往往會非常負 EV。

原因在於當中了 A 或者 K 時，你會無法捨棄，而出現很高的反向賠率。具體來說就是當對手拿著 AQ 而你拿著 A2 的時候，同樣中了 A，但是對手會從你的身上攫取很大的價值；

感性的認知：當我們看到一個團隊有非常強的一個核心創始人但是沒有合夥人，或者技術能力特別強但是商業化能力極其欠缺的時候，也就相當於這樣的牌型。

如果現在看到類似的團隊，我們會關注團隊的完整性以及互補性，希望每一個 A 的創始人都能找到他的另一半 A 或者 K、Q 的合夥人。

3）最好的團隊是否能帶來最大的收益？

可以看到最好的起手牌確實帶來了最大的收益，也印證了我們之前說的基石原則，持續尋找並且投資最優秀的創始人團隊。

以上的分析和討論，只是一些結合自身經驗的想法，很多比喻不一定完全恰當，希望讀者們能多多指正，畢竟投資跟德州撲克還是完全不同的兩項事物。

新的一年很多行業又將面臨洗牌，so let’s shuffle up and deal and may the best man win!

當「風險投資」遇上「德撲」

您可能也會喜歡…