400-888-5228

課程長度:

48課時

 

培訓目的:

第一部分? 數(shù)據(jù)挖掘和 SPSS Modeler

課程將介紹數(shù)據(jù)挖掘原理、SPSS Modeler數(shù)據(jù)挖掘軟件的基本操作和環(huán)境;學習如何使用SPSS Modeler讀取,處理數(shù)據(jù)

目的

培訓人員能夠掌握數(shù)據(jù)挖掘理論和常用的建模技術、掌握機器學習的常見技術,比如神經網(wǎng)絡、決策樹等,并將其應用到具體業(yè)務操作中

 

第二部分 ?SAS數(shù)據(jù)分析和數(shù)據(jù)挖掘

課程基于SAS工具進行數(shù)據(jù)分析和挖掘

目標:

將各種類型的數(shù)據(jù)讀入SAS數(shù)據(jù)集中

對SAS數(shù)據(jù)集進行校驗和清洗

創(chuàng)建SAS變量和數(shù)據(jù)子集

合并SAS數(shù)據(jù)集

創(chuàng)建增強列表和總結報表

 

第三部分 ?R語言實戰(zhàn)

R語言作為一種數(shù)據(jù)分析專業(yè)語言,是當今數(shù)據(jù)科學領域最流行的開源編程語言之一,在數(shù)據(jù)分析與機器學習領域已經成為一款最重要的工具。精通R語言的數(shù)據(jù)分析師是企業(yè)競相爭搶的高薪人才。

R語言實戰(zhàn)課程采用MBA式的案例教學,結合統(tǒng)計理論,建模方法論、R語言編程和老師的豐富實際項目經驗,力求讓每一個學生都能夠把學到的知識運用到實際工作中去。我們精選的案例是目前企業(yè)真實場景下應用很廣泛的場景,集合了互聯(lián)網(wǎng)用戶分析、精準營銷、風險評估、BI設計與實施等領域的數(shù)據(jù)挖掘實例,對您從事真正的數(shù)據(jù)分析工作有針對性的指導與幫助。

 

目標:

  1. 深度學習R語言和數(shù)據(jù)挖掘的前沿算法
  2. 理解企業(yè)真實業(yè)務場景的建模流程
  3. 熟練使用R語言進行建模和實操
  4. 成為有多種技能并能融會貫通的復合型數(shù)據(jù)分析人才

培訓大綱:

第一部分? 數(shù)據(jù)挖掘和 SPSS Modeler

  • 數(shù)據(jù)挖掘簡介
  • CRISP-DM方法論
  • SPSS Modeler簡介
  • SPSS Modeler的C/S架構和界面介紹
  • SPSS Modeler可視化程序的使用基礎
  • 讀取數(shù)據(jù)文件
  • SPSS Modeler可以讀取的數(shù)據(jù)格式
  • 讀取文本數(shù)據(jù)與查看數(shù)據(jù)、SPSS數(shù)據(jù)、數(shù)據(jù)庫數(shù)據(jù)(SDAP)
  • SPSS Modeler中的字段類型、字段方向
  • 保存SPSS Modeler流
  • 數(shù)據(jù)理解---數(shù)據(jù)質量評估
  • 數(shù)據(jù)理解
  • 缺失值定義
  • 數(shù)據(jù)審核節(jié)點介紹
  • 分布圖節(jié)點----初步理解字符型字段的分
  • 直方圖/統(tǒng)計節(jié)點----初步理解數(shù)值型字段的分布
  • 簡單數(shù)據(jù)整理
  • Clem語言簡介
  • 選擇節(jié)點,過濾節(jié)點和導出節(jié)點介紹
  • 自動生成操作節(jié)點
  • 尋找數(shù)據(jù)中的關系
  • 矩陣節(jié)點、網(wǎng)絡圖節(jié)點、統(tǒng)計節(jié)點、散點圖節(jié)點、直方圖節(jié)點
  • SPSS Modeler中的數(shù)據(jù)建模技術
  • 神經網(wǎng)絡、規(guī)則歸納模型、模型比較
  • 聚類分析、關聯(lián)規(guī)則、序列檢測

 

第二部分 ?SAS數(shù)據(jù)分析和數(shù)據(jù)挖掘

  • Base SAS基礎
  • SAS 系統(tǒng)簡介
  • 啟動SAS 軟件
  • SAS 窗口環(huán)境
  • SAS 文件和邏輯庫
  • 一個簡單的SAS 程序
  • 讀取外部數(shù)據(jù)到SAS數(shù)據(jù)集
  • SAS 編程基本概念
  • 通過DATA 步讀取數(shù)據(jù)
  • 通過IMPORT 過程讀取外部文件數(shù)據(jù)
  • 訪問關系型數(shù)據(jù)庫系統(tǒng)中的數(shù)據(jù)
  • SAS 程序錯誤及處理
  • 對單個數(shù)據(jù)集的處理
  • 選取部分變量
  • 操作數(shù)據(jù)集的觀測
  • 創(chuàng)建新變量
  • 循環(huán)和數(shù)組
  • SAS常用函數(shù)
  • 將數(shù)據(jù)集寫出到外部文件
  • 對多個數(shù)據(jù)集的處理
  • 數(shù)據(jù)集的縱向串接
  • 數(shù)據(jù)集的橫向合并
  • 數(shù)據(jù)集的更新
  • 數(shù)據(jù)匯總和展示
  • 通過PRINT過程制作報表
  • 通過TABULATE過程制作匯總報表
  • 通過GPLOT過程制作圖形
  • 通過GCHART過程制作圖形
  • ODS輸出傳送系統(tǒng)
  • 案例解析:PRINT過程操作實例
  • 案例解析:匯總報表實例
  • 案例解析:GPLOT過程制作圖形編程操作
  • 案例解析:GCHART過程繪制圖形編程操作
  • 描述性統(tǒng)計分析
  • 基本概念
  • 描述性統(tǒng)計量
  • MEANS過程的補充
  • 案例解析:利用MEANS過程求各種統(tǒng)計量
  • 案例解析:利用UNIVARIATE過程求各種統(tǒng)計量
  • 案例解析: 頻數(shù)表的生成實例
  • 參數(shù)估計與假設檢驗
  • 參數(shù)估計
  • 假設檢驗
  • 非參數(shù)假設檢驗
  • 分別擬合假設檢驗
  • 案例解析:TTEST過程的實例數(shù)據(jù)分析
  • 案例解析:總體均值檢驗
  • 案例解析:實驗數(shù)據(jù)的配對T檢驗
  • 案例解析:數(shù)據(jù)比例的顯著性檢驗
  • 案例解析:樣本數(shù)據(jù)的正態(tài)性檢驗實例
  • 回歸分析
  • 變量關系探索
  • 線性回歸
  • 自變量間的共線性診斷
  • 案例解析:某大型服裝連鎖機構門店收入相關數(shù)據(jù)分析
  • 案例解析:分析可支配收入和消費性支出之間的關系
  • 案例解析:利用線性回歸分析學生肺活量及有關變量的關系
  • 方差分析
  • 方差分析的基本原理
  • 單因素試驗的方差分析
  • 顯著因素下的水平間差異檢驗
  • 雙因素試驗的方差分析
  • 案例解析:分析四種止痛藥效果之間是否有明顯差異
  • 案例解析:分析三種飼料的營養(yǎng)價值之間有無顯著性差別
  • 案例解析:分析不同實驗室試制的紙張光滑度有無差異
  • 主成分分析與因子分析
  • 主成分分析概述
  • 使用SAS 實現(xiàn)主成分分析
  • 因子分析概述
  • 使用SAS 實現(xiàn)因子分析
  • 案例解析:我國某年經濟發(fā)展情況的主成分分析
  • 案例解析:中國房地產經濟區(qū)的研究分析
  • 聚類分析和判別分析
  • 聚類分析的概述
  • 劃分法與層次法
  • 判別分析概述
  • 判別分析在SAS中的實現(xiàn)
  • 案例解析:聚類分析在客戶定位中的應用研究
  • 案例解析:變量聚類在多指標系統(tǒng)評價中的應用
  • 案例解析:基于判別分析法的上市公司財務分析研究
  • LOGISTIC回歸分析
  • 基本原理
  • 運用LOGISTIC過程擬合模型
  • LOGISTIC過程的其他語句
  • 建立模型
  • 案例解析:LOGISTIC回歸用于上市公司ST預測

 

  • SAS數(shù)據(jù)挖掘流程
  • SAS 數(shù)據(jù)挖掘概述
  • 確定業(yè)務問題和數(shù)據(jù)準備
  • 數(shù)據(jù)抽樣、探索與加工
  • 數(shù)據(jù)建模
  • 案例解析:X公司貸款業(yè)務案例分析
  • 案例解析:關聯(lián)規(guī)則與購物籃問題分析
  • 案例解析對股票交易數(shù)據(jù)進行聚類分析
  • 案例解析:信用風險評分卡的開發(fā)與應用

 

第三部分 ?R語言實戰(zhàn)

1.1、數(shù)據(jù)結構概述

1.2、向量

1.3、因子

1.4、矩陣

1.5、數(shù)據(jù)框

1.6、列表和函數(shù)

1.7、向量化計算和apply

2.1、線性回歸的思想

2.2、回歸結果的檢查

2.3、決定系數(shù) 預測 和多元線性回歸

2.4、一元線性回歸演示

2.5、多項式回歸演示

2.6、殘差分析演示

2.7、多元線性回歸演示

3.1、關聯(lián)規(guī)則介紹

3.2、關聯(lián)規(guī)則演示

4.1、決策樹介紹C4.5

4.2、幾種分類算法介紹

4.3、評價模型準確性