首页 / 炒股看点 / 股票大数据挖掘实战-股票大数据挖掘平台

股票大数据挖掘实战-股票大数据挖掘平台

日期:2022-01-11 02:08:28

读书笔记:

全书我大概观摩了一下,得到的收获有三个方向:
1.对于本书在【时间序列】上的庸俗化处理让人颇为失望,龟缩到斜率和拐点两个位置上来,
当然,按照一般的教科书来铺开,我估计也不会看的太懂。
2.对于时间序列,资金流向,筹码分析,股票估值,券商研报,舆情,股民行为分析决策模型
有一些认知。尤其是在对于【股民行为分析】涉及到的行为金融学有点开始重视,由于一般是
自证,没有引入理论,所以在整体上的思考就显得十分凌乱,
自相矛盾,在本书的基础上建立初步的行为金融学的认知和一些基础也是不错的。
3.对于耳熟能详的尽可能省略,对于自己成本,精力胜任的应当详细记录,并且配合进度表进
行更新相应的知识点,重点体验一下【数据挖掘】。

前沿

任务:从海量数据提取有用并且便于理解的模式。
对象:从大量的,不完全的,有噪声的,模糊的,随机的数据提取银行在其中的,人们视线不知道但
有用的信息和知识的过程。

第一章股票基础

1.1股票投资入门

1.1.1股票市场

【略】

1.1.2常用名称解释

【略】:注意数据使用前复权。

1.1.3股票交易规则

【略】:实盘设计和回测要重视股票规则。

a.交易制度:T+1,休市,交易单位【手】
b.撮合成交【这里是回测中最容易忽略的点,尤其是在回测资金上的设计,
涉及金额不能想一些书中一样百万、千万起步,很容易面临实盘买不到的情况,
徒增干扰,噪音。
c.费用:回测中比较重要的部分,一般会设置滑点来过滤,有些则是提出用90%资金
来进行交易,默认不动10%。

1.2影响股价的因素

这里主要重视两个方向:
1.供求关系
2.宏观经济周期中的资金流向,从而建立传导性的逻辑分析体系,目前这个由三个部分组成:
2.1美国加息
2.2shibor,银行间资金
2.3三大指数【或者增加行业或者二级指数】


1.3股票的基本面分析

1.3.1基本面分析概述

1.3.2企业基本面分析

1.3.3主要财务指标

1.3.4杜邦分析法

可作为财务分析的模块化处理,并返回,目前不需要,作为备用。

1.4股票的技术分析方法

重申自己的技术模块和思维认知:
1.市场行为涵盖一切信息
2.股价变化有迹可循
3.历史重演
技术分析为主,均线技术为核心手法,辅助其他指标进行买点卖点确认,重视统计和数据分析

1.4.1技术分析概述

趋势理论
波浪理论
江恩理论:射线
箱体理论:突破理论,拐点理论
缺口理论:普通缺口,突破缺口,持续性缺口,消耗性缺口
具体的技术分析应当参考,融合的技术部分:趋势,箱体【突破理论】

1.4.2经典技术理论分析法

1.4.3K线图分析法

1.4.4技术指标分析法

趋势类指标,能量类指标,成交量类指标,摆动类指标,大盘类指标
按照这些分类进行知识体系的归类,用于梳理和整合
其中除摆动类指标没有涉及,其他指标均有所涉及。
趋势类指标:均线指标
成交量类指标:成交量+均线指标
大盘类指标:逐步添加大盘指标,二级指标,行业指标
资金类指标:搜索主力指标

1.4.5量价结合分析法【血的教训】

成交量与股价的关系:成交量是股票的元气,而股价则是成交量的反映,
成交量的变化是股价变化的前兆。
血的教训:在成交量充足的地方进行交易

1.4.6主力动向分析法【血的教训】

我们所有的做法都是在找寻主力的踪迹,从实战来看,一般谋求强势突破,在长期均线之
上马上有所收获,尤其是对于小资金而言,时间上的等待不利于快速积累和发展,
所以发现目标,应当尽可能进行跟踪,备选,观察。
这个是血的教训,作为散户,我们等不起,需要明确的形式确立,我们才能参与。

1.5两类方法的区别与联系


1.6股市风险【所要具备的素质,能力,视野】

1.掌握必要的证券专业知识
2.认清投资环境,把握投资机会【这一点说到我心坎里面来了】
3.确定合适的投资方式
4.制定周详的资金运作计划【按照行情,策略来拟定】
5.正确选择投资目标

第2章股票分析技术指标与买卖点计算

2.1目标概述

提出一种新的基于长短期线的买卖点计算方法

2.2股票分析技术指标

意义在于:通过数理统计进行实证,以概率分析,判断走势的可能性,并且这些技术指标不仅仅
蕴含买卖点,还包括对于后市的看法和研判。
但是按书中这样子理解,也是不对的,如果加上宏观角度来进行分析,这种截断就会显得很明显,
一般的回测不会估计第三方信息和影响,单纯的是以个股本身的数据进行统计分析,这样子的解释
环境下,因子的有效性会大打折扣,自然也就会制造出很多噪声,干扰信号,尤其是个股本身在
不同的环境下还有不同的表现下来看。因此只能将整体回测的结果与第三方,自身强弱系统判断
的环境进行分类处理,再进行因子比较。

2.2.1移动平均线

主要策略之一:均线,用于负责两个方面的任务:
1.买卖点
2.强弱分析【尤其是强弱点的分析上,一律要在长期均线以上开仓,严禁在均线以下开仓,
这一点,尤其是日线,60分钟线尤为重要。血的教训】


这里只关注三个部分:
1.突破
2.回踩
3.波浪在趋势下的位置【即下跌,跌破的可能】

2.2.2平滑异同移动平均线指标

【略】
但是要引入两个概念:顶背离,底背离,并且进行分析。

2.2.3随机指标

【略】:kdj

2.2.4动向指标

【略】:DMI

2.2.5累积能量线指标

OBV

2.2.6相对强弱指标

RSI

2.2.7乖离率指标

BIAS

2.2.8顺势指标

CCI

2.2.9平行线差指标

DMA
AMA

2.2.10三重指数平滑移动平均线指标

TRIX

2.2.11威廉指标

WR

2.2.12BOLL指标

布林带

2.2.13腾落指数

ADL
这个指数可以参考,主要是上涨家数-下跌家数,用于与大盘指数涨跌幅进行匹配分析,查看大盘风格,
指数是否失真等情况。

2.2.14涨跌比率指标

ADR

2.2.15超买超卖指标

OBOS
这个指数也可以用,N日上涨股数总合,同理2.2.13

2.3新方法: 基于长短期线的买卖点计算

2.3.1主要思想

1.股票买卖点计算框架
2.策略
3.积极进取,稳健方式
4.参数训练
5.统计收益,分析买卖点位置
6.估计明天的买卖点条件【这个的确需要,在BS系统里有,根据位置,成交量等来进行综合分析,但是条件这个事情有点暧昧,主要还是取决于策略的约束条件,如果约束条件比较少,自然也就没有任何意义,等待即可,不停刷新价格,就好了】
新名词:二分查找


2.3.2计算步骤

在本书的40页,这个思路分类是非常不错的,一个是对于策略的理论进行了梳理,流程化处理,一个是对实操的梳理,流程化处理。

基本结构是:

1.提出理论框架-应用理论基础-策略采取-策略评估和调整

2.需要的计算因子-计算方法-调参-评估


2.3.3方法步骤与创新特征

【略】:因为不采用这个策略

2.3.4平台实战解析

同理

第3章股票时间序列的特征表示方法

本章主要是是通过时间序列分析,得出斜率变化和拐点计算来分析趋势变化

3.1目标概述

理论内容

  • 关注短期内股票价格变化的预测,该研究方法不仅需要解决数据高频带来的问题
  • 关注对股票价格拐点的预测,进而确定股票的交易信号

实战中

  • 拐点收益最大化【基本上就是低点附近】
  • 对于拐点的提取,预测模型建立等【按作者来看,通过时间序列预测拐点目前没有很好的方法】

本章内容

  • 时间序列基础,分析方法
  • 特征表示方法,提出新的股票历史数据分段方法【本书的主要目的】
  • 应用示例


3.2股票时间序列

3.2.1时间序列的基本概念

适用条件
人们研究时间序列,通常也是希望根据历史数据预测未来的数据,对于时间序列的预测,由于很确定它与其他因变量的关系,或收集因变量的数据非常困难,因此不能采用回归分析方法进行预测,而是使用时间序列分析的方法
理论假设
总是假定某一数据变化模式或者某一组合模式会发生重复
适用时间范围
中短期预测,因为在较短的时间内,数据变化的模式不会特别明显。
应用领域
系统描述:根据对系统进行观测得到的时间序列数据,用曲线拟合方法对系统进行客观的描述。
系统分析:当观测值取自两个以上变量时候,可以用一个时间序列中的变化去说明另一个时间序列中的变化,从而深入了解给定时间序列产生的机制。
预测未来:一般用ARMA模型拟合时间序列,预测该时间序列的未来值
决策和控制:根据时间序列模型可调整输入变量,使系统发展过程保持在目标值上,即预测到过程要偏离目标时,便进行必要的控制。


3.2.2时间序列的影响因素

  1. 趋势型
  2. 周期性【循环】
  3. 季节性变化
  4. 不规则变化

3.2.3时间序列的分类

  1. 研究对象多少:一元,多元
  2. 按时间的连续性:离散,连续
  3. 序列的统计特性分:有平稳,非平稳


3.2.4时间序列分析概述

分析方法

  1. 确定性时序分析:指暂时过滤掉随机性因素(比如季节因素,趋势变动)进行确定性的 分析方法,其基本思想是用一个确定的时间函数y=f(x)来拟合时间序列,不同的变化采取不用的函数形式来描述,不同变化的叠加采用不同的函数叠加来描述,具体可以分为趋势预测法,平滑预测法,分解分析法

2.随机性时序分析:其基本思路是通过分析不同时刻变量的相关关系,揭示其相关结构,利用这种相关结构建立自回归,滑动平均,自回归滑动平均混合模型

分析流程

研究对象-采集数据生成序列-数据处理-模型识别-参数估计-建立模型-模型检验-预测与控制

3.2.5确定性时间序列分析

1.移动平均法:

公式

预测值=最后N个值的平均

N的意义

N值越小,表明对近期观测值预测的作用越重视,预测值对数据变化的反应越迅速,但是预测的修匀程度较低,估计值的精度也可能降低。

时间序列修匀就是消除时间序列中的偶然变动,使其呈现出趋势变动的一种方法。常用的方法有移动平均法,加权移动平均法等。当要消除季节变动的影响时就要采取各种不同的移动平均方法
  • 简单算术平均法
  • 加权算术平均法
  • 一次移动平均法
  • 加权移动平均法
  • 二次移动平均法

2.指数平滑法

  • 一次指数平滑法
  • 二次指数平滑法

3.季节系数法

4.趋势延伸法

  • 线性趋势预测模型
  • 二次曲线趋势预测模型

3.2.6随机性时间序列分析

【说实话,我通过Python接触的都是这种随机性时间序列分析】

  • AR(p)
  • MA(P)
  • ARMA(P)
  • 非平稳性时间序列模型

3.3股票时间序列的特征表示方法

3.3.1方法概述

股票时间序列特征表示和相似性度量在数据挖掘的分类,聚类,关联等挖掘任务中起到最基础同时也是非常关键的作用。对于股票时间序列的特征表示与相似性度量进行基础性的研究,会使得数据挖掘打开新的局面,出现新的不同机会。
时间序列的特征表示与相似性度量也是对要解决的问题的基础理解,理解正确,方法模型可行,对时间序列要解决的问题使用数据挖掘功能就有更大的机会得到好的解决方案。股票时间序列特征表示对股票时间序列的 降维,用股票时间序列的部分值来代替股票时间序列本身。
时间序列一方面与其他时间序列一样要求拟合误差低,压缩率高,另一方面需要把时间序列的趋势特征更好地保留下来。

3.3.2时间序列特征表示

将原始序列映射为特征序列,并使用特征序列的特征值来表示原始序列。在保留原始序列的主要特征的基础上对时间序列进行一定程度的压缩。目前基于特征提取的数据压缩表示方法有几种:

1.频域表示法

  • 中心思想:将时间序列当做一个离散的信号,用离散小波变换或者离散傅里叶变换,将时间序列从时间域映射到频率域,用少量的频率值来模拟原始时间序列数据,大大地压缩了数据,保留了时间序列的主要值分布情况。

2.奇异值表示法

数据本身或其某阶导数在魔衣时刻点存在突变,突变的起一点往往含有比较重要的信息。

不过从时间序列等理论知识的简单了解来看,尽管在现有的数据工具上无法去理解,
但是我们可以用编程语言去达到这个效果,或者说我们也可以用近似的理论去求解,
尽管在精度上可能存在一定的差异性。




3.符号化表示法

是将时间序列应声到一个符号序列,是将时间序列离散化。时间序列本身是连续值,通过波形变换将几个划分在同一区域的数值应声到一个离散的符号值,每一段时间间隔内的序列对应一个符号,从而将整个时间序列装换为符号序列。

时间序列数据的一种符号化表示方法



3.3.3基于斜率提取特征点的时间序列分段线性表示

3.3.4基于趋势转折点的时间序列模式表示

3.4新方法: 基于拐点检测的股票历史数据分段方法

3.4.1主要思想

3.4.2计算步骤

3.4.3方法步骤与创新特征

3.4.4结果及分析

3.5新方法: 基于精准高低点分段匹配的股票预测方法

3.5.1主要思想

3.5.2计算步骤

3.5.3方法步骤与创新特征

3.5.4结果及分析

第4章股票资金流向与主力控盘分析

4.1目标概述

4.2聚类分析

4.2.1聚类与聚类分析简介

4.2.2聚类算法的分类

4.2.3层次聚类算法

4.2.4KMeans聚类算法

4.2.5FCM聚类算法

4.3资金流向分析

4.3.1资金流向分析法简介

4.3.2资金流向分析法的内容

4.3.3在实际应用中的适用性问题及解决方案

4.4新方法: 基于资金流向分析的主力控盘能力计算方法

4.4.1主要思想

4.4.2计算步骤

4.4.3方法步骤与创新特征

4.5平台实战解析

4.5.1主力资金与散户资金的博弈

4.5.2主力参与度和主力的控盘能力

4.5.3如何站在股市的风口

4.5.4诊断个股的全局风口位置

第5章股票筹码分析技术与实战

5.1目标概述

5.2筹码分析技术

5.2.1成本转换原理

5.2.2筹码分布的原理

5.2.3筹码分布的形态

5.2.4筹码分布的使用

5.2.5筹码理论的优缺点

5.3新方法: 基于涨跌幅排序的股票异动跟踪方法

5.3.1主要思想

5.3.2计算步骤

5.3.3方法步骤与创新特征

5.3.4输出结果示例

5.4平台实战解析

5.4.1买卖盘价量分布下的填坑式变动趋势

5.4.2持仓筹码的集中度与成本获利解析

5.4.3跟随超级大股东的动向并与“王”共舞

第6章财务数据分析与股票估值

6.1目标概述

6.2股票财务指标

6.2.1盈利能力指标

6.2.2偿债能力指标

6.2.3成长能力指标

6.2.4营运能力指标

6.3股票定价理论

6.3.1股票的价格

6.3.2传统股票定价理论

6.3.3现代股票定价理论

6.3.4现代金融工程

6.4正态分布

6.4.1参数与统计量

6.4.2正态分布性质

6.4.3经验规则的运用

6.5新方法: 基于自身历史相似收益的股票估值方法

6.5.1主要思想

6.5.2计算步骤

6.5.3方法步骤与创新特征

6.5.4平台实战解析

6.6财务指标可视化

6.6.1财务指标可视化概述

6.6.2主要财务指标

6.6.3维度财务指标

6.6.4财务综合打分

第7章券商研报评级及其有效性分析

7.1目标概述

7.2对券商研究报告进行研究

7.2.1券商研究报告的内容组成

7.2.2研究报告与股市关系的研究方法

7.2.3研究报告现状

7.3一致性预期

7.3.1一致性预期概述

7.3.2一致性预期的计算

7.3.3一致性预期的用法

7.4平台实战解析: 研报评级及其有效性分析

7.4.1机构研报的评级

7.4.2机构评级的有效性

7.4.3机构研报聚合

7.4.4个股热度分析

第8章股票舆情分析

8.1目标概述

8.2文本挖掘

8.2.1文本挖掘技术简介

8.2.2文本挖掘分类

8.2.3文本挖掘的过程

8.3新闻文本分类

8.3.1文本分类简介

8.3.2文本分类流程

8.3.3互联网股票新闻文本分类实验

8.4股吧情感分析

8.4.1情感分析概述

8.4.2情感分析方法

8.4.3股吧股评情感分类实验

8.5平台实战解析

8.5.1聚合众股吧帖子的与涨跌分析

8.5.2实时跟踪企业和行业动态

8.5.3深度挖掘潜在的隐藏信息

第9章股民行为分析与应用

9.1目标概述

9.2行为金融学

9.2.1行为金融学概述

9.2.2行为金融学的心理研究

9.2.3股民心态

9.2.4行为金融学的四大成果理论

9.2.5行为金融学在投资方面的实践意义

9.2.6行为金融学主张的投资策略

9.3协同过滤

9.3.1个性化服务

9.3.2协同过滤概述

9.3.3基于用户的协同过滤

9.3.4基于物品的协同过滤

9.3.5两种协同过滤算法的比较

9.3.6其他技术

9.4平台实战解析: 用户潜在行为分析与热门股发现

9.4.1用户的自选股分析

9.4.2用户的点击热度分析

第10章股票交易决策模型

10.1目标概述

10.2经典的股票交易决策模型

10.2.1沃伦·巴菲特的交易决策模型

10.2.2威廉·欧内尔的交易决策模型

10.2.3彼得·林奇的交易决策模型

10.2.4约翰·内夫的交易决策模型

10.3新方法: 股票数据挖掘模型

10.3.1模型思路

10.3.2模型介绍

10.3.3模型构建步骤与创新特征

10.4股票大数据挖掘平台简介

10.5平台实战解析

10.5.1股票雷达与多维分析

10.5.2超短线攻略: 抓住突变的逆转特征玩偷袭

10.5.3短线攻略: 资金筹码助力技术特征建仓位

10.5.4中长线攻略: 寻找待填平的估值洼地做价值投资

参考文献

微信二维码
标签