
利用“大數據”和“人工智能”技術來進行股票投資并不少見,但深挖技術背后的投資理念,發現最為關鍵的不是技術,而是使用技術的人。喬布斯用一堆手機零件創造出了蘋果手機,雷軍用一堆手機零件組裝出了小米,二者使用的技術沒有本質區別,區別在操盤者的見地。
?
股票投資并不是一個簡單的事情,每一個在股市里浸染過的人都知道這一點,這個行業不僅需要專業的技術分析能力,還要有對信息綜合分析、整理以及正確解讀的能力。多數時候后者更為重要,因為到目前為止,從技術分析層面,人們仍然無法解釋驅動股票價格忽上忽下背后的原因,更多時候專家們更愿意將它比作“布朗運動”,微小粒子無規律的撞擊運動。然而從消息面的角度,對股價的波動卻總是能找到“合理”的動因,人們會不厭其煩挖掘出“布朗運動”背后每一個“微小粒子”運動的原因,以期能總結出規律。顯然這是一個浩瀚的工程,數據的分析量異常大,盡管如此,仍有人不懼挑戰。
?
擁有計算機博士學位,在華爾街沉浸多年的金融科技“老炮兒”于洪鈞就是其中之一,他帶領著一群來自充滿干勁的金融和互聯網人,要利用“大數據+人工智能”技術來完成對“毫無規律”的股價波動的解讀。目前于洪鈞創立的搜股科技已經獲得千萬元級別Pre-A輪融資。于洪鈞告訴《經理人》,他要用這個來解決散戶所面臨的信息不對稱和專業能力不足的問題,讓他們免于被“荷槍實彈”的機構和莊家血洗。
?
淘金大數據
?
近年來,在中國的許多行業,談及創新、談及利用新技術,無不牽扯到一個概念—大數據。制造業用大數據來分析銷售和進行生產,交通部門用大數據來進行交通管理,衛生部門用大數據來防治疾病,金融公司利用大數據來進行投資和放貸。似乎一切都在和大數據發生關系,但是當我們在談論大數據時,大數據其實是一個很大、很復雜的概念,包括數據的采集、清洗、挖掘、儲存、計算、顯化等。拋開“大數據”這個熱詞,其實各行各業都在做與數據有關的事情,只不過數據要做到一定的規模才能稱為“大”數據。
?
大數據技術除了要求數據的規模,更要求對數據的清洗和挖掘。其實在中國,擁有最多數據的并不是私人部門,而是政府部門和國有企業,如教育部門、社會保障部門、公安部門、電信運營商等,但是目前這些公共部門尚未找到對大數據清洗、挖掘的合適方法。私人部門對于大數據卓有成效的運營案例也十分稀少,其中最主要的原因就在于對數據的清洗、挖掘方面一直不能有效展開,簡單來說就是找不到數據之間的關系。
?
全球零售業巨頭沃爾瑪曾有一段被“大數據”分析界傳為佳話的成功案例。沃爾瑪在對消費者購物行為分析時發現,男性顧客在購買嬰兒尿片時,常常會順便搭配幾瓶啤酒來犒勞自己,于是嘗試推出了將啤酒和尿布擺在一起的促銷手段,沒想到這個舉措居然使尿布和啤酒的銷量都大幅增加了。按照傳統的商品分類、消費品分類,啤酒和尿布之間完全沒有任何聯系,這個案例不僅反應了大數據的神奇效果,更反映了找到數據之間關系的難度。
?
于洪鈞告訴《經理人》,數據就像河里的沙子,大家都可以看到,但并不是每個人都能做到“沙里淘金”。于洪鈞是美國名校畢業,擁有計算機科學專業博士學位,精通數據挖掘。同時,他曾在全球知名銀行摩根大通總部工作6年并擔任要職,隨后轉戰全世界最大的獨立另類資產管理機構之一黑石華爾街總部工作,有17年中國A股市場實戰經驗,10年美國股票市場實戰經驗。從這些經歷不難看出,游走于科技的投資之間的于洪鈞,是當之無愧的金融科技“老炮兒”。
?
正是得益于自己的豐富閱歷,于洪鈞對從大數據這個沙堆里淘金,充滿信心。他深諳投資之道,明白數據背后蘊藏的內在邏輯。目前搜股科技擁有4000臺服務器,監測61.2萬個網站,包括1428個中文媒體和6000個支干媒體,數據及時性確保在60秒以內,這在目前的炒股軟件中抓取信息能力最強,是市面上多數軟件的3倍。強大的基礎設施保證了搜股科技能夠抓取到足夠多的數據量,來進行更為精確的分析。
?
在搜股科技開發出來的“股票衛士”APP中,有一個新聞在全網影響力指數的欄目。這個欄目通過對一條新聞信息的全網追蹤,來分析它在網民心目中的影響力。在網絡時代剛剛到來的時候,人們憂慮于虛假信息對社會造成的沖擊,甚至為了保護未成年人,我們用簡單粗暴的不讓他們上網的方式來解決這個復雜的問題。盡管現在這個問題隨著社會的發展、人們知識的積累而慢慢弱化,但并不是已經完全消失。虛假、失實、烏龍的消息仍然見諸于各種網站、貼吧、論壇。基于抓取網絡數據的搜股科技,又如何辨別信息的真實性、可靠性呢?
?
于洪鈞認為,信息一旦發出,不論真假都會在人們的心里產生一定的影響,對于搜股來說,重要的不是信息的真假,而是這個信息產生了什么樣的反映,可能會導致什么結果。從《經理人》對“股票衛士”APP的使用情況來看,多數新聞的影響力都在10%以內,依據此來進行推薦的股票仍漲跌互現。于洪鈞表示,目前仍無法確切分辨信息的全網影響力指數與股價之間的關系。例如,有些信息的全網影響力超過10%,反而消息被過度解讀,不利于股價。對于數據關系的解密注定是一個長期的過程,需要大量的實踐才能發現其中微妙的聯系,目前“股票衛士”仍處在內測階段。隨著數據的積累,算法的跌進,距離謎底將越來越近。
?
人工智能
?
大數據解決了散戶面臨的信息不對稱的問題,人工智能則將在大數據的基礎之上解決散戶專業能力不足的問題。 今年3月,韓國棋手李世石對陣人工智能機器人AlphaGo,以1:4的成績敗下陣來,讓絕大部分圍觀人士都傻了眼,出乎預料的不是敗了,而是敗得太快。在圍棋這一極具人類思維特性的領域,機器人竟能趕超得這么快,人類竟會輸得那么慘。從人工智能的角度而言,AlphaGo代表了人工智能發展到了一個新的水平。
?
作為計算機博士,于洪鈞對人工智能一直有所關注。人工智能可以說是建立在大數據之上,因為只有數據庫足夠大,人工智能才可以充分學習,才可能最接近人類的思考方式。目前谷歌的AlphaGo是一個開源項目,搜股科技也將利用這一技術,來進行自己的人工智能應用開發。需要說明的是,盡管AlphaGo人工智能技術是一個開源的技術,但是并不意味著什么人都利用這個技術輕易的能做出一個很好的人工智能產品。“技術只是手段,怎么使用更為關鍵。”于洪鈞表示。
?
一款手機拆開來,99%的技術都是大家共同可得到,但是有些手機做成了蘋果,有些手機做成了小米。在大數據和人工智能的實際運用中,有機的應用技術就類似于做手機,零件可能都大同小異,但是對于整體設計理念的不同,將使得產品出現極大的差異。