米蘭


在終極的分析中,一切知識都是歷史;在抽象的意義下,一切科學都是數學;在理性的基礎上,所有判斷都是統計!
這段讓人感觸頗深的話是筆者從《SAS技術內幕》的扉頁上讀到的。
2019年初,清華大學出版社出版了一本數據分析著作《SAS技術內幕:從程序員到數據科學家》,作者為數據分析行業巨頭SAS中國研發中心技術總監巫銀良先生,作序者為北京大學信息科學技術學院博導張銘教授。
作為數據分析專業性的SAS著作,該書至今在當當網上依然顯示為100%的好評,實屬難能可貴。循序漸進掌握數據分析要義和精髓,從數據中獲取洞見和智慧,應當是該書著作者的核心宗旨。
獲得業內大咖聯袂推薦的《SAS技術內幕》分上下兩卷。上卷著重介紹SAS程序的語法與實踐,下卷著眼于統計學以及數據分析相關內容的介紹以及在SAS程序上的應用。正如該書的副標題“從程序員到數據科學家”,它確實很好地為廣大程序員和數據分析師架起了一座橋梁。
書中的知識點很好地兼顧了系統性、邏輯性和易讀性:程序員需要了解的SAS編程知識,數據分析師需要了解的統計、數據分析相關理論,該書都有很全面的介紹。同時,知識的引入、切換也順理成章,邏輯性很強。更妙的是,書中所帶豐富的代碼示例,讓讀者可以輕松上手,自助學習、實踐和調試。代碼所用的數據大部分都源自系統自帶,或通過簡單幾行代碼創建,盡量照顧到讀者使用該書進行練習的便捷性。
該書上卷第2章詳細介紹了SAS傳統的DATA步,并在第7章引入了SAS的第二代數據處理步DS2的介紹;在第12章到第17章,則分別介紹了不同數據結構在SAS編程中的應用。
下卷第18章在介紹統計學基礎知識時,加入了詳盡的SAS產品與過程步概覽,涵蓋了幾乎所有的BASE SAS和SAS/STAT過程步。讀者不僅能從書中學到相關的統計學知識,而且可以把它當成常備工具書使用。
作者在一些章節不時為讀者對知識點進行總結,譬如第20章的附錄 (P403:各統計分布之間的關系) 揭示了統計分布之間的簡明清晰的邏輯關系,便于讀者記憶和理解(如圖2)。
該書最后一章詳細論述了圓周率? 的高精度求解方法與探索分析,令人嘆為觀止。該書附錄提供了業界最精確完整的統計學查表及其制作方法,涵蓋二項分布,泊松分布,標準正態分布的累積概率表以及 t 分布, 分布,F 分布不同顯著性水平 α 下的臨界值表。
該書涉及的知識內容全面,知識層次由淺入深,同時也涵蓋技術和分析領域的前沿科技,無論是初學者,還是相關領域從業者,都會從本書中得到不同程度的收獲。
責編/龐貝