当前位置: 主页 > 散文 > 优美散文 > >

【中信建投 金融工程】父亲数据周报:择时持续

时间:2019-07-04来源:原创 作者:locoy阅读:
  

  原题目:【中信建投 金融工程】父亲数据周报:择时持续飘红,选股多空差高臻4.67%!

  【尽第31期】

  中心不雅概念

  1

  父亲数据父亲盘择时

  2017年08月31日收回看多记号,近期却适当加以仓,上周择时进款为0.12%。从2014年01年02日到2017年09年08日,多仓单个记号平分进款2.2%累计进款200.49%;空仓记号单个平分进款0.24%,积聚进款4.33%。

  2

  成事神物情选股体即兴

  以神物情指数排名前5的个股干为多头,以排名倒腾数前5的干为空头,该战微上周多空进款差为4.67%。己2014年以后到多空累计进款为197.95%,年募化进款为35.34%,最父亲回撤27.57%。

  3

  构成体即兴

  上周多头构成进款2.12%,就中,万科A(000002.SZ)上周上涨幅高臻11.95%;

  上周多头构成对立沪深300指数超额进款2.24%,而空头构成对立沪深300指数超额进款为-2.32%。

  4

  下周伸荐列表

  下周建议多头与空头构成见注释列表。

  壹、父亲数据体系构建

  1.1

  数据收集儿子与预处理

  父亲数据的源头品质,直接决议我们目的品质,决议着我们的战微优劣性。当前,国际的相干数据到来源首要为第壹类上提交所,深提交所等的公报、财报,接管信息等;第二类财经成事网站,譬如新浪网,第壹财经,正西方财富网,中国证券网,金融界,雪球财经,腾讯财经,第壹财经等的个股成事,行业成事,微不清雅经济等;第叁类社提交媒体,譬如股吧,贴吧,微落等;第四类为关怀数据,譬如佰度,搜狗等个股每天搜索数及剖析师研报提及个股等。我们当前数据首要爬取新浪网个股相干成事,带拥有200多家媒体在内的所拥有个股成事。

  父亲数据收集儿子则是经度过网绕爬虫或网站地下API等方法从上述相干网站上获取我们所需寻求的数据信息,将匪构造募化数据从网页中爬取上,并松析相干信息,将其存放储为壹致的该地数据文件,并以构造募化的方法存放储在我们的数据库中。

  

  数据预处理指直接从网页爬取的数据并不能直接用于运用,而是需寻求经度过壹定的预处理,以保障数据品质和数据装置然。鉴于在父亲数据运用中,数据到来源什分普遍,数据品质泥沙俱下全,更需寻求预处理经过。数据预处理首要是去摒除无法松析的错误网页,删摒除重骈的数据,去摒除拥有效的数据等;将不一的数据源爬取到的数据壹致存放储,确立数据仓库栈。

  1.2

  父亲数据存放储技术

分享到:
最新评论 查看所有评论
加载中......
发表评论
用户名:(新注册) 密码: 匿名

栏目导航

推荐阅读

热门阅读