印象中,大數據分析剛興起沒多久,“人人都是數據科學家”的呼聲已經不絕于耳。大數據分析不應該成為極少數數據科學家的專利,而應該成為所有業務人員最有力的工具!
人們寄希望于圖數據庫,因為它可以完成許多關系型數據庫幾乎不可能完成的任務,讓企業更輕松地執行更具豐富意涵的實時分析,以及從數據中發掘可以真正改變人們生活的洞察,并使所有人都可以使用可擴展的圖分析,從關聯數據中釋放真正的價值。
圖分析領域的佼佼者TigerGraph 已經成立8年,其主打產品也演進到3.0 版本,但是圖分析總讓人有種“叫好不叫座”的感覺。這是因為圖分析的高門檻讓企業用戶望而卻步嗎?

TigerGraph 中國區總經理 烏明捷
其實,圖分析本身并不想拒人于千里之外,它可以適用于各種規模的企業。從新興的初創公司到全球財富1000 強企業,它們都在使用TigerGraph的高級圖分析構建前瞻性應用程序就是最有力的證明。比如,全球前五大銀行中有四家在使用TigerGraph 進行實時欺詐檢測;同時,依托TigerGraph,全球超過3 億消費者獲得了實時個性化服務,5000 萬醫療保健患者受益于量身定制的護理路徑建議。那么,到底是什么壓抑了圖分析潛在的巨大能量的釋放呢?
從圖分析使用者的角度也許可以找到蛛絲馬跡。圖分析的使用人群大致可以分成三類:IT 運維人員、應用開發人員,以及非技術專業的企業業務人員。一些圖分析廠商一開始就將IT 運維人員和應用開發人員作為主要的服務對象,圖分析成了“陽春白雪”,動輒就要寫腳本、寫代碼,需要數據科學家這樣的高端專業人才才能完成部署和分析。而普通的業務人員對于圖分析只能仰望,卻不能親自動手參與其中。
TigerGraph 中國區總經理烏明捷談到了一種比較普遍的情況,在初步搭建圖分析系統,進行簡單嘗試之后,甚至還沒有看到圖分析帶來的改變,很多用戶便放棄了。這說明,圖分析確實存在入門的門檻,比如用戶要對圖數據庫的相關概念有一定了解,而且要掌握基本的圖分析方法和工具等。
TigerGraph 中國區總經理烏明捷表示,圖分析一定要平民化,讓圖數據庫物盡其用。圖分析并不限于固定的行業或場景,而應該讓所有人受益!
2 0 2 0年 3月,TigerGraph 正式發布了TigerGraph 3.0,其最有意義的一項演進是無需寫代碼,只通過拖拽的方式就能讓用戶完成基本的圖分析工作。在筆者看來,這是一項雖平凡但又影響深遠的改變。說它平凡,因為“No Code”這項工作本身的技術門檻并不高,圖分析廠商如果想做都可以實現;說它影響深遠,是因為大家都能做的工作,但是很多“技術范兒”的廠商并沒有將它提到日程上來,仍然圍繞專業人員作文章,只有TigerGraph在用戶實實在在需求的推動下,第一個將它落地實現,或許這樣一項小小的創舉,就可能打開圖分析普及化的閘門。
以TigerGraph 3.0 為新開端,它可以讓企業用戶在圖分析方面快速入門,先有圖才談得上用好圖。從低成本的試用開始,先做一些簡單的探索,不用了解相關算法,只需通過鼠標拖拽,就能在短時間內看到最直接的結果,待有持續深入探索的需求后,企業再加大投入,采用更加專業的工具和方 法,在TigerGraph 平臺之上完成專業的圖分析。從少量場景的探索入手,循序漸進,逐步將圖查詢等遷移到更大規模的集群中,直至進入生產環境,這才是圖分析貼近用戶、深入行業的正確姿勢。
按照Gartner的說法,圖數據存儲可以跨數據孤島有效地建模、探索和查詢具有復雜關聯關系的數據,但是目前需要專門技能才能實現,實際上限制了其應用。這就可以理解為什么TigerGraph 將圖可視化提升到如此重要的地位。這有點像把略顯晦澀的文言文轉成通俗易懂的白話文,不是技術上的問題,而是思路上的轉變,最終目的是擴大對知識的探索,將圖思維和工具普及化、平民化。
TigerGraph 究竟是如何實現圖可視化的呢?以TigerGraph 3.0 為例,它增強了包括使用直觀的拖放功能運行圖查詢的能力。
TigerGraph 3.0 在 提供核心平臺功能的同時,提供易用的“No code”高級圖分析:通過提供No code方式進行模式(Schema)轉換,并把數據加載到圖中,實現從關系型數據庫No code 遷 移;使 用Visual Query Builder(可視化查詢構建器)的No code 圖分析,類似于可視化數據建模,非技術人員通過繪制所需的模式即可生成和運行圖查詢;在分布式環境中實現簡單和快速的部署,更方便地在TigerGraph 平臺中導入更龐大的數據集并進行分析;用戶定義的索引允許用戶提高特定查詢的數據庫性能,支持點和范圍查詢,以及高性能的時間序列和地理空間應用。
無論用戶的專業技術能力如何,借助TigerGraph的No code 圖分析功能,都可以通過圖方便地實現高級分析應用。
眾所周知,標準化是降低產品使用門檻,加速新技術普及的重要驅動力。專屬圖查詢的國際標準化語言GQL 可能在2021年發布,烏明捷認為這將對圖分析的應用起到重要促進作用。采用圖分析,用戶必須翻越的“成本關”有二:一是機器的成本;二是人力成本,其中就包括學習成本。烏明捷不止一次聽到客戶的擔憂:“我選擇一個分析平臺,就像在做一道單選題,如果技術人員學習了一門開發語言,在投入大量學習成本后,將來又要轉換到另一個產品或平臺,必須重頭再學一門新的語言,這讓我們在選擇平臺時非常糾結。”
TigerGraph 以身作則,自主開發的GSQL 語言將完整支持GQL 圖查詢語言國際標準。烏明捷相信,此語言國際標準的誕生將大大降低客戶學習和使用的成本,就像現在的關系型數據庫一樣,只要掌握了標準的SQL,再學其他語言時,只要學習額外新增的功能即可,而基本的語法不會有太大變化。無論是No code 還是GQL 國際標準,都可以進一步打消用戶對使用圖分析的顧慮,對整個圖分析市場的發展十分有利。
“我們現在的一項重要工作就是與企業的科技創新部門、大數據分析部門一起,教育企業的業務部門,讓他們能夠真正了解圖分析的價值所在?!睘趺鹘莘治稣f,“讓業務部門接納一項新技術,除了必須考慮技術的成熟度和易用程度以外,最重要的其實并不是科技本身,而是如何利用科技為業務帶來價值,這才是推動圖分析走向深入的關鍵?!?/p>
特別值得一提的是,云的興起對于圖分析來說也是一個助力。越來越受到客戶歡迎的TigerGraph Cloud 提供了20 多種模板,用戶選擇其中一個行業模板,在幾分鐘內便可搭建一個圖環境并使用。據烏明捷透露,TigerGraph 已 經在和國內的云服務商洽談合作的可能。
“TigerGraph 平 臺的演進聚焦使用簡單、更好融合、最佳的容量和性能支持?!盩igerGraph 解決方案工程師李憓松介紹說,TigerGraph 3.0 可以更好地與分析平臺和數據進行融合,具備企業級用戶所需的大容量和領先業內的高性能,可以進行真正的圖分片、分布式存儲和分布式運算。
針對開發者,TigerGraph 3.0 提供了屬性索引、算法、從關系型數據庫遷移到圖等先進技術,旨在提高開發效率;提升GSQL 語言,比新增GSQL 聯合模式匹配(Conjunctive Pattern Matching),新 推出的Per 子句主要是在聯合模式匹配下,方便進行多步遍歷,靈活高效進行聚合運算;提供更加靈活的查詢模式等。針對IT 運維人員,TigerGraph 3.0 通過平臺管理、漢化的用戶界面、Studio 中的多圖等,大幅提升運維效率。針對普通的業務人員,尤其是無基礎的圖分析新人,TigerGraph 3.0 提供了無代碼分析工具,可以快速完成圖探索和圖查詢,降低了應用的入門門檻。李憓松特別提到了新增的直譯查詢功能。以往,用戶在對查詢進行修改或調試后,還要再經過編譯才能進行下一次查詢,連貫性體驗不佳,而直譯查詢則提升了查詢效率。
“相對于以前的版本,TigerGraph 3.0 實現了全面的提升,包括系統的穩定性、運維的易用性,以及支持PB 級的數據量等,為管理員提供了一套完整的界面,包含數據備份、安全等都有了較大改進,提高了工作效率。另外,我們開源了GSQL 算法庫,提供中文界面和更好的本地服務支持?!睘趺鹘荼硎?,通過不斷演進,TigerGraph 將變更加成熟、穩定,支持更大的數據量,幫助更多用戶將圖技術應用到日常工作中。
談到未來圖分析領域的技術和應用發展趨勢,李憓松總結了以下幾點。
首先,企業用戶越來越看重對于單個用戶的行為分析,這就要求參數的靈活化,以及數據不同的遍歷結構的靈活化,同時對于多并發情況下的性能要求非常高,通常是毫秒級的,而這些正好是圖分析比較擅長的。其次,將圖分析和傳統BI 相結合,構建更靈活的即席探索平臺,進行不止建模,預測,最優化的高級分析。再次,傳統的機器學習是一個“黑盒”,而圖分析可以進行更好地進行解釋,有助于提升機器學習的準確性和可解釋性。最后,批量的圖分析也是一個需求方向。
再回到文章一開始提到的圖分析“叫好不叫座”這個問題,歸根結底,廣大的企業用戶還沒有建立起一種新的“圖思維”,仍然比較依賴傳統關系型數據庫,或者在關系型數據庫遇到瓶頸時才想到圖分析。其實,圖分析的應用場景更豐富。TigerGraph 就歸納了圖分析的七大場景,比如路徑的發現、模式的匹配、子圖的發現等。目前,我們看到圖分析在金融、電信、醫療等領域比較火,而實際上,工業、能源、電商、制造業、物流等千行百業都是圖分析的用武之地。在抗擊疫情的過程中,也有TigerGraph的身影。
如果說利用傳統關系型數據庫進行的數據探索是平面的,那么圖分析就是立體的,可以進行更深入、更多維、更準確的分析。如果用戶從一開始就將自身的業務與圖之間建立對應關系,也許可以更快地達到探索的彼岸。TigerGraph的價值在于,為客戶提供一個快捷、簡便的圖分析工具,讓用戶可以在很短的時間內先建立圖,初步嘗試之后很快判定是否可行,然后再決定是否繼續更深入的探索。
“讓我們的客戶真正從圖和圖分析工具中受益。這是TigerGraph 做所有事情的出發點?!睘趺鹘萑缡钦f。