
0人評分過此書
統計學關鍵字典:大數據時代,如何為你的履歷加分?113個統計學的基本公式、定理與法則
本書收錄於此書展...
~大數據時代,用統計學為你的履歷加分~ 推薦給所有勇於跨領域、學習新知的專業職場人! 【本書特色】 ◎專書彙整113個廣泛應用於各領域的統計學公式和定理,讓需要統計學的人學習更有效率。 ◎每一節以五顆星標示「難易度」、「實用性」與「考試機率」,重點觀念一目瞭然。 ◎獨立專欄列舉實例,讓初學者快速掌握統計學在日常生活的實際應用。 生活在互聯網的時代,統計學的知識在所有的領域都不可或缺。 尤其是商業領域,統計學在「市場行銷」、「企業決策」、「人工智慧」、「關鍵字檢索」等各個領域都受到廣泛的運用。 但是統計學的知識,有其嚴謹的定義和使用框架。 儘管我們在學生時代學過基本的統計方法,比如平均數、中位數、標準差、機率,但是實際面對市場調查或財務報表時,往往也不知道該如何運用這些數據幫助我們分析現況、對未來下決策。 實際上,即使是經常在實務中應用統計方法的人,往往在接手全新的專案時,便沒辦法比照舊有方法,導致所學知識派不上用場。即使想認真學習,也常因為統計學是一門專業科目,若非花費大筆報名費用參加課程,便是得尋覓坊間參考書自行鑽研,而在學習上浪費大量的時間。 本書正是為所有想學習統計學的人,提供最有效率的學習途徑。 書中彙整重要的公式、定理、統計方法和理論,以跨頁形式歸納基本內容,並透過生活實例示範該統計方法的應用範疇。 本書架構根據應用類型,分為以下11個大類別: ●敘述統計▸▸你認為國民的所得平均值是多少?這個數值能代表你的所得嗎? ●相關關係▸▸取一個數值,表現工作時數與睡眠時數的相關性 ●機率▸▸能從過去的中獎結果,預測下次的中獎號碼? ●機率分布▸▸五次推銷,能夠成功簽約的機率是多少? ●估計▸▸節目收視率差1%,這樣的差距算大嗎? ●檢定▸▸想證明新藥是否有療效,證據就是檢定 ●無母數檢定▸▸東京某醫科大學的錄取率,是否存在性別差異? ●迴歸分析▸▸一個公式,就能預測高級葡萄酒的價格 ●變異數分析與多重比較法▸▸輕鬆排定工讀生的排班表 ●多變量分析▸▸透過結構分析調整組織,使人才能夠適得其所 ●貝氏統計▸▸信箱過濾器簡單區分垃圾郵件的方法從國高中學習的「資料整理」與「機率和統計」, 到大學或專業科目深究的「估計」、「檢定」、「迴歸分析」與「多變量分析」, 乃至於大數據時代不可或缺的「貝氏統計」。 本書涵蓋目前統計學所有的應用領域,並以大百科的檢索條目般一一羅列,有助於初學者掌握整體的面貌。 據說特斯拉的創始人伊隆・馬斯克,在9歲時就讀完整部大英百科全書。 本書作為統計學的百科全書,儘管不能保證各位在創業時,業績能像火箭一飛沖天,但絕對能讓你成為具備統計觀的一流商務人士。 在資訊愈來愈多樣、數量不斷增加且產生速度飛快的未來,唯有運用統計學,才能幫助我們的命運進行貝氏更新。 ※因應印刷需要,內頁預覽顏色與實際印刷不同,敬請見諒。※
- 序言
- 本書的特點和使用方法
-
Chapter 1 敘述統計
-
Introduction
-
統計學的歷史
-
資料整理不可或缺的敘述統計
-
-
01 資料尺度
-
度量水平分為四種
-
Business 史蒂文斯冪次定律
-
-
02 次數分配表和直方圖
-
首先將資料整理成次數分配表
-
根據次數分配表製作直方圖
-
用直方圖找出虛報資料
-
-
03 柏拉圖
-
根據相對次數、累積相對次數分配表製作柏拉圖
-
Business 用柏拉圖分析生產不合格產品的原因
-
-
04 上下標和sigma符號
-
可以製作大量文字
-
使用Σ符號,就能簡短地表示總和
-
-
05 平均、變異數、標準差
-
平均值和變異數的意義
-
Business 用變異係數比較兩組資料的分散程度
-
-
06 次數分配表與平均值、變異數
-
利用組值計算平均值和變異數
-
真實值和利用次數分配表計算的值有誤差
-
-
07 代表值
-
平均實際上有各種類型
-
中位數有兩種模式
-
直方圖讓眾數一目瞭然
-
Business 對於所得平均值沒有實際感受的理由
-
-
08 變數的標準化
-
製作標準化的變數(standardized variable)
-
Business 偏差值使用標準化
-
-
09 偏度、峰度
-
偏度(skewness)是表示直方圖偏態的指標
-
峰度(kurtosis)是表示直方圖高度的指標
-
Business 似乎比常態分布更能發現異常
-
-
10 四分位數、盒鬚圖
-
試著計算四分位數
-
根據直方圖可以畫出盒鬚圖(box-and-whisker plot)
-
-
11 交叉表
-
熟悉行列、表側、表頭、周邊次數、總次數等用語
-
Business 用三重交叉表營造良好的職場氛圍
-
-
12 圓餅圖、橫條圖、折線圖
-
試著解讀圖表
-
Business 南丁格爾用獨創的圖表控訴糟糕的衛生環境
-
-
13 散佈圖
-
首先試著標記在散佈圖上
-
Business 利用散佈圖制定全球戰略
-
Business 用散佈圖矩陣預測女性的升遷
-
Business 有錢人活得久
-
-
14 羅倫茲曲線
-
利用零用錢的資料繪製羅倫茲曲線
-
Business 用吉尼係數預測國家的穩定性
-
-
15 Q-Q圖
-
用常態Q-Q圖將偏離常態分布的偏差可視化
-
Business 利用常態Q-Q圖,確認是否可以視為常態分布
-
-
Column 從莖葉圖解讀資料的代表值
-
-
Chapter 2 相關關係
-
Introduction
-
什麼是相關?
-
相關關係必須注意的事項
-
-
01 皮爾森相關係數
-
用相關係數判斷量的資料的相關性
-
相關係數與散佈圖
-
Business 別忘了回到散佈圖
-
-
02 斯皮爾曼等級相關係數
-
斯皮爾曼等級相關係數的解釋
-
試求斯皮爾曼等級相關係數
-
Business 找出工作時間與睡眠時間的關係
-
-
03 肯德爾等級相關係數
-
肯德爾等級相關係數的解釋
-
有相同等級時調整分母
-
Business 利用肯德爾等級相關係數找出工作時間和睡眠時間的相關性
-
-
04 克雷莫V係數
-
V值為1時相關性高,為0時相關性低
-
Business 年輕人和中年人對於音樂的愛好不同嗎?
-
-
05 相關係數的估計和檢定
-
估計的公式十分複雜⋯⋯
-
透過無相關檢定確認是否存在相關關係
-
Business 調查各公司銷售額相關關係的信賴水準
-
-
06 自我相關係數
-
自我相關係數的計算機制和解釋
-
時間序列模型{Yt}的自我共變異數
-
Business 用相關圖找出銷售額的週期性
-
-
Column 有許多可疑的相關
-
-
Chapter 3 機率
-
Introduction
-
源自賭博的機率歷史
-
古典機率論的完成
-
統計學和機率論的發展,奠定數理統計學的基礎
-
-
01 事件與機率
-
機率的基本知識和事件的意義
-
以骰子為例,試著思考機率和事件
-
Business 撲克牌型的機率
-
-
02 取捨原理
-
取捨原理的證明
-
Business 計算順利交換禮物時的機率
-
-
03 離散型隨機變數
-
離散型隨機變數的例子:擲硬幣出現正面的次數
-
Business 試著把彩券製成機率分布的表格
-
-
04 連續型隨機變數
-
連續型隨機變數的例子:時鐘指針停止的位置
-
Business 量子力學的領域存在著肉眼可見的機率密度函數
-
-
05 累積分布函數
-
計算累積分布函數的方法
-
Business 試著用累積分布函數來表示30年內發生地震的機率
-
-
06 期望值、變異數
-
計算彩券的期望值
-
計算飛鏢得分的期望值
-
Business 想靠賭博發財,就要認識賠率
-
Business 金融商品的價格是根據期望值決定
-
Business 利用平均值和變異數模型成為億萬富翁
-
-
07 獨立事件和獨立隨機變數
-
區分獨立事件和非獨立事件
-
隨機挑選卡片時,十位數和個位數是獨立的嗎?
-
Business 預測樂透號碼購買,只是在浪費錢
-
-
08 隨機變數的和與積
-
Business 組合隨機變數,計算獎金的期望值
-
-
09 二維隨機變數(離散型)
-
即使是無相關也未必獨立
-
Business A先生是會被金錢誘惑的勢利眼嗎?
-
-
10 二維隨機變數(連續型)
-
解釋邊際機率密度函數
-
Business 計算飛鏢遊戲的獎金期望值
-
-
11 期望值和變異數的公式
-
隨機變數之和的期望值,等於各隨機變數期望值之和
-
Business 買幾盒牛奶糖才能完成收集
-
-
12 大數法則、中央極限定理
-
保證機率的大數法則
-
大樣本在中央極限定理中被視為常態分布
-
Business 損害保險公司不會倒閉的原因要歸功於大數法則
-
-
13 柴比雪夫不等式
-
柴比雪夫不等式的意義
-
大數法則的證明
-
-
Column 計算班級裡有兩人同一天生日的機率
-
-
Chapter 4 機率分布
-
Introduction
-
機率分布有很多種類的原因
-
特別重要的四個機率分布
-
-
01 伯努利分布、二項分布
-
n愈大,愈近似常態分布
-
Business 利用二項分布計算五次推銷中成功簽約X件的機率
-
-
02 幾何分布、負二項分布
-
s+1次以後的成功機率與歷史無關
-
稱為負二項分布的原因
-
Business 「抽中中獎籤為止的次數」的真正意義
-
-
03 卜瓦松分布
-
與罕見現象次數相關的機率分布
-
卜瓦松極限定理
-
Business 日常生活中隨處可見卜瓦松分布
-
-
04 超幾何分布
-
理解超幾何分布的公式
-
n愈大,愈近似二項分布和卜瓦松分布
-
N愈小,有限母體校正愈有效
-
Business 估計某種生物棲息數量的方法
-
-
05 均勻分布、指數分布
-
指數分布是無記憶性的連續型機率分布
-
Business 利用指數分布計算20年內發生地震的機率
-
-
06 常態分布
-
有不少服從常態分布的例子
-
Business 利用高爾頓板實際感受一下常態分布
-
-
07 x²分布、t分布、F分布(概述)
-
從樣本瞭解母體時所需的分布
-
Business 針對蘋果的重量進行推論統計
-
-
08 x²分布、t分布、F分布(詳述)
-
觀察定義式,想像它代表什麼樣的統計量
-
t分布的特徵司徒頓化
-
F(m,n)和F(n,m)的關係很有用
-
-
09 韋伯分布、柏拉圖分布、對數常態分布
-
Business 什麼是生存函數和風險函數?
-
Business 適用於所得、股價和人壽保險的價格
-
-
10 多項分布
-
計算邊際機率質量函數和共變異數
-
Business 行駛在國道246號,遇到4次紅燈、5次綠燈、6次黃燈的機率
-
-
11 多維常態分布
-
寫出二維的情況
-
計算平均值、變異數、共變異數
-
Business 接待高爾夫利用二維常態分布來克服
-
-
Column 用軟體計算機率分布的值
-
-
Chapter 5 估計
-
Introduction
-
推論統計是指根據資料進行預測和判斷
-
大樣本理論與小樣本理論
-
不偏變異數和樣本變異數
-
-
01 抽出放回和抽出不放回
-
只要母體夠大,即使是抽出不放回,也可以視為獨立
-
計算樣本平均數的期望值和變異數
-
Business 想成為職業賭徒,就要以抽出不放回來一決高下
-
-
02 抽樣方法
-
隨機進行抽樣
-
利用分層抽樣抑制變異數
-
Business 從前用骰子,現在靠軟體?將隨機發揮到極致吧
-
-
03 最大概似法
-
選擇概似度最大的θ(模型)
-
Business 利用最大概似法估計上門推銷的成交機率
-
-
04 區間估計的結構
-
考慮抽樣造成偏差的區間估計
-
有△%機率落入區間的說法謬誤
-
-
05 常態母體的母體平均數區間估計
-
區間估計的原理
-
Business 試著估計蘋果重量平均值的區間
-
-
06 母體比例的區間估計
-
最好也理解母體比例估計的結構
-
Business 收視率調查中的1%差距算大嗎?
-
-
07 估計量的評價基準
-
不偏性(期望值成為估計的母數)
-
有效性(不偏估計量中變異數愈小愈好)
-
一致性(取極限作為母數)
-
充分性(機率視估計量決定,而不是由母數決定)
-
-
08 不偏估計量
-
確認母體平均數、母體變異數的不偏估計量
-
勝算(Odds)沒有不偏估計量
-
高斯-馬可夫定理所呈現的最佳線性不偏估計量
-
-
Column 容易混淆的標準差和標準誤差的差別
-
-
Chapter 6 檢定
-
Introduction
-
檢定的學習方法
-
內曼和皮爾森建立的假設檢定
-
-
01 檢定的原理和步驟
-
Business 檢定歲末的抽獎是否有詐
-
注意接受(採納)虛無假設時的解釋
-
-
02 檢定統計量
-
Business 記憶中的全國平均值是正確的嗎?
-
什麼是雙尾檢定、單尾檢定?
-
-
03 檢定的錯誤
-
計算型一和型二錯誤的機率
-
-
04 常態母體的母體平均數檢定
-
檢定母體平均數時的檢定統計量計算方法
-
Business 檢定左右來回跳躍的全國平均值
-
-
05 常態母體的母體變異數檢定
-
檢定母體變異數時的檢定統計量計算方法
-
Business 檢定全國握力統計的變異數
-
-
06 母體平均數差的檢定(1)
-
檢定母體平均數差時的檢定統計量計算方法
-
Business 檢定「兩所大學的平均分數有差異」是否顯著
-
-
07 母體平均數差的檢定(2)
-
貝倫斯-費雪問題非常棘手
-
Business 針對「兩所大學的平均分數存在差異」進行Welch’st檢定
-
Business 利用單一樣本資料差的檢定求得減肥效果
-
-
08 母體比例差的檢定
-
母體比例差的檢定原理
-
Business 檢定A市和B市汽車持有率的差異
-
母體比例差的檢定與獨立性的檢定相同
-
-
09 變異數同質性檢定
-
用F分布檢定變異數比的變異數同質性檢定
-
Business 針對男女的考試結果進行變異數同質性檢定
-
-
Column 醫療現場所進行的檢定
-
-
Chapter 7 無母數檢定
-
Introduction
-
什麼是無母數檢定?
-
無母數檢定的種類
-
-
01 適合度檢定
-
Business 檢定是否為公正的骰子
-
-
02 獨立性檢定(2×2的交叉資料表)
-
Business 檢定入學考試對性別是否公平
-
觀測次數較小時就修正檢定統計量
-
-
03 獨立性檢定(k×l的交叉資料表)
-
Business 檢定不同世代喜歡的歌曲類型是否存在差異
-
-
04 費雪精確檢定
-
在已知總計的情況下,計算交叉資料表的機率
-
Business 根據少數對戰結果檢定力士的實力差距
-
-
05 McNemar檢定
-
McNemar檢定是從忽略相同結果的方向來思考
-
Business 檢定銷售演講是否打動聽眾的心
-
-
06 Cochran的Q檢定
-
Business 檢定藝人的人氣是否存在差異
-
-
07 Mann-Whitney的U檢定
-
Business 檢定團隊的銷售業績是否存在差異
-
與Wilcoxon等級和檢定的關係
-
-
08 符號檢定
-
Business 利用符號檢定來檢定清潔劑的滿意度是否存在差異
-
與Wilcoxon符號等級檢定的區別
-
-
09 Wilcoxon符號等級檢定
-
用a或b來檢定都可以
-
Business 脈搏數在平靜下來後再測量會下降嗎?
-
-
10 Kruskal-Wallis檢定
-
若樣本大小在14以下,就用表格查出拒絕域
-
Business 檢定藝人的好感度是否存在差異
-
-
11 Friedman檢定
-
單一樣本單因子變異數分析的無母數版
-
Business 旅行社針對旅行企劃檢定四季好感度
-
-
Column 統計學容易混淆的用語集
-
-
Chapter 8 迴歸分析
-
Introduction
-
什麼是迴歸分析?
-
迴歸分析是具有外在效標的多變量分析
-
-
01 單變量迴歸分析
-
最小平方法是計算迴歸線式子的原理
-
Business 預測缺考的第7位新人的多益成績
-
-
02 複迴歸分析
-
從單變量迴歸到複迴歸
-
測量迴歸方程式的準確度
-
Business 利用複迴歸分析來預測出租公寓的租金
-
-
03 複相關係數和偏相關係數
-
用複相關係數測量迴歸方程式的準確度
-
利用偏相關係數找出偽相關
-
Business 利用偏相關係數找出偽相關,重新考慮變更配置
-
-
04 多重共線性
-
三維資料若存在多重共線性會變成什麼情況
-
找出多重共線性的方法和回避方法
-
-
05 單變量迴歸分析的區間估計
-
迴歸線的區間估計結構
-
-
06 邏輯式迴歸分析、Probit迴歸分析
-
Business 針對年收入與擁有房屋的相關性進行迴歸分析
-
邏輯式迴歸與對數勝算有關聯
-
-
07 一般線性模型和一般化線性模型(GLM)
-
複迴歸分析和變異數分析也是一般線性模型的一種
-
擴張一般線性模型的一般化線性模型
-
-
Column 對葡萄酒價格進行複迴歸分析
-
-
Chapter 9 變異數分析與多重比較法
-
Introduction
-
能以變異數分析和多重比較法解決的問題
-
利用多重比較法思考虛無假設族
-
-
01 變異數分析(概述)
-
根據變異(平方和)建立變異數比
-
Business 哪個地方的汽車配件銷售較佳?
-
-
02單因子變異數分析
-
Business 利用變異數分析檢定肥料效果的差異
-
整理成變異數分析表
-
確認變異數分析的模型
-
-
03 雙因子變異數分析(無重複試驗)
-
利用雙因子變異數分析(無重複試驗)尋找最佳日照和肥料的條件
-
利用變異數分析檢定三組的平均值是否一致
-
也可以視為單一樣本的單因子變異數分析
-
-
04 雙因子變異數分析(有重複試驗)
-
Business 可以調查肥料和日照有無交互作用
-
Business 填寫變異數分析表,檢定有無交互作用
-
-
05 費雪三原則
-
用費雪三原則進行農業實驗
-
Business 預防安慰劑效應的檢定法
-
-
06 正交陣列表
-
使用正交陣列表可以有效地進行實驗
-
在不考慮交互作用的情況下,用正交陣列表制定實驗計劃
-
利用正交陣列表考慮交互作用,制定實驗計劃
-
Business 利用正交陣列表輕鬆製作工讀生的排班表
-
-
07 Bonferroni法和Holm法
-
重複k次時將每次的顯著水準都設為k分之1的Bonferroni法
-
彌補Bonferroni缺點的Holm法、Shaffer法
-
-
08 Scheffé法
-
可以客製化虛無假設的Scheffé法
-
只要在變異數分析被拒絕時使用即可
-
-
09 Tukey-Kramer法
-
Business 一次檢定哪兩個工廠存在差異
-
-
Column 現代推論統計學的始祖—費雪
-
-
Chapter 10 多變量分析
-
Introduction
-
什麼是多變量分析?
-
主成分分析和因子分析的方法完全相反
-
-
01 主成分分析(概述)
-
尋找使陰影長度的平方和最大的平面
-
Business 把咖啡豆品牌化
-
-
02 主成分分析(詳述)
-
二維資料的主成分分析
-
Business 貢獻率可說是資料的活用度
-
-
03 判別分析(概述)
-
產生函數來判斷未知資料屬於哪一組
-
Business 下個破產的信用合作社在哪裡!
-
-
04 判別分析(詳述)
-
線性判別函數的計算方式
-
-
05 馬哈拉諾比斯距離
-
根據馬哈拉諾比斯距離來判別的機制
-
Business 二維資料的判定,也可以只比較兩組資料
-
-
06 數量化Ⅰ類、Ⅱ類
-
使用質的資料作為解釋變數的數量化理論
-
用反應變數進行判別的數量化Ⅱ類
-
-
07 數量化Ⅲ類、對應分析
-
斜向排列1
-
數量化後重新排列
-
Business 中階管理職因為工作壓力太大而抽煙
-
-
08 因子分析
-
因子分析的使用方法
-
Business 對國外品牌進行因子分析
-
因素負荷量不止一種
-
-
09 共變異數結構分析
-
設計路徑圖
-
Business 透過共變異數結構分析使人才適得其所
-
-
10 階層式集群分析
-
繪製樹形結構關係圖
-
Business 相似的人歸類在一起分配工作
-
-
11 多元尺度法(MDS)
-
簡潔表示個體間非相似度的多元尺度法
-
Business 用多元尺度法找出新的品牌定位
-
-
Column 製作定位圖的方法
-
-
Chapter 11 貝氏統計
-
Introduction
-
與我們的思考方式相近的貝氏統計
-
直到貝氏統計得到學術上的認可
-
-
01 條件機率
-
用文氏圖來理解條件機率
-
Business 計算通勤方法的條件機率
-
-
02 單純貝氏分類器
-
即使是條件機率,若為獨立,也可以用乘積表示
-
Business 什麼是簡單區分垃圾郵件的方法?
-
-
03 貝氏定理
-
用文氏圖理解貝氏定理成立的理由
-
Business 做好疾病檢查呈陽性時的心理準備
-
-
04 貝氏更新(離散版)
-
隨意回答的機率也是主觀機率
-
Business 新進飯店員工能透過貝氏更新來追蹤錯誤嗎?
-
-
05 蒙提霍爾問題
-
蒙提霍爾問題的常見解法
-
實際上這個解法也未必正確
-
-
06 貝氏更新(連續版)
-
根據離散型的條件機率公式求連續型
-
Business 通過貝氏更新重新認識自我而成長的新進業務員
-
-
07 共軛事前分布
-
Business 透過共軛事前分布的貝氏更新來確定目標的資深業務員
-
把機率模型的形式和共軛事前分布製成表格
-
-
08 KL散度
-
與熵的相關性
-
KL散度的課題
-
Business 用KL散度選擇預測模型
-
-
09 AIC(赤池訊息量準則)
-
AIC有助於找到好的模型
-
Business 參數多不一定是好的模型
-
-
10 蒙地卡羅積分
-
用蒙地卡羅法計算面積
-
蒙地卡羅積分成立的理由
-
Business MCMC負責貝氏統計的計算
-
-
11 Gibbs抽樣法
-
Gibbs抽樣法的形象
-
Business 資料為高維時,Gibbs抽樣法很有用
-
-
12 Metropolis-Hastings演算法
-
為何可以簡單地製作f(x)的樣本?
-
a的取法也有需要想辦法的時候
-
-
13 貝氏網路
-
昏睡狀態下出現頭痛症狀,為轉移性癌症的機率是多少?
-
Business 成為機器學習和人工智慧的模型
-
-
Column 機器翻譯的機制
-
-
Appendix
-
1 標準常態分布表(右尾機率)
-
2 t分布表(右尾2.5%、5%點)
-
3 x²分布表(右尾97.5%點、5%點、2.5%點)
-
4 F分布表(右尾5%點)
-
5 F分布表(右尾2.5%點)
-
6 Mann-Whitney的U檢定表(單尾機率2.5%點)
-
7 Wilcoxon符號等級檢定表(單尾2.5%點、5%點)
-
8 Friedman檢定表(單尾5%點)
-
9 Kruskal-Wallis檢定表(單尾5%點)
-
10 司徒頓化的範圍分布表(右尾5%點)
-
- 後記
- 索引
- 出版地 : 臺灣
- 語言 : 繁體中文
評分與評論
請登入後再留言與評分