数据处理方法有哪些型数据处理方法有哪些的显示方法主要有哪些?

你有没有觉得学习数据分析方法时很痛苦?本文,笔者用简单易懂的文笔总结出来一套易学易用的数据分析方法论,让初学者快速掌握数据分析方法中最核心、最常用的要点,至少能满足90%的日常需求。
学习对大多数人而言是一件痛苦的事情,尤其看着厚厚的专业书籍、各种难以理解又缺乏解释说明的术语定义,会让这种痛苦加剧。但是有些书或文章能将复杂的理论用非常通俗、口语化的方式讲述出来,让读者不费劲,一下就能明白。这些内容实在是读书人的一种福音。说到底,互联网思维中的用户思维谈了这么久,教育、培训类内容的创作者们也应该好好改变一下,站在读者的角度说话了。
本文谈的是数据分析方法。根据笔者对众多企业的接触和了解,虽然现在大部分企业都对数据越来越重视,但目前仍有相当多的企业和从业者还没有摸清数据分析的门道,不知道自己的数据该怎么分析,希望得专业人员的到帮助。
1、数据分析方法一点也不神秘
笔者以前学习数据分析方法时也很痛苦,看了不少书,内容很多,但难以记全,更难以运用,后来加入永洪科技给众多企业做数据分析系统,通过大量的项目实践,才慢慢能谈得上入门。
好的方法论应该是易学易用的。现在,本文就努力尝试用最简单易懂的文笔,让初学数据分析的人看完就能理解并掌握数据分析方法中最核心、最常用的要点,至少能满足90%的日常需求。做到这一点,必须将博大精深的数据分析方法提炼成人们能记得住的3点,而不是30点,再浓缩到一篇文章的篇幅,而不是一本书的厚度。
1)数据分两种,维度和度量,分析就是维度和度量的组合
下面是一个最简单的消费者购物的数据例子。
先不管这个数据表是存在excel里还是数据库里,只关注数据本身。表里涉及到的数据项(或者叫字段)有&订单ID&、&用户ID&、&地区&、&年龄&、&订单金额&、&订单商品&、&订单时间&。
这些数据项有什么差异呢?总体而言,数据分两种,一种叫维度,一种叫度量(或者叫指标)。上面这个例子里,&订单金额&是度量,其余数据项都是维度。
可以看出,度量是具体的计算用的量化数值,而维度是描述事物的各种属性信息。我们在做数据分析时,归根结底就是在不停的做各种维度和度量的组合,比如北京地区的订单金额总和,21到30岁用户的订单金额平均数;或者单独对维度和度量进行数学公式计算,比如所有的订单金额总和,用户数(用户ID的不重复计数)等等。
从数据类型上看,度量都是数值,但是数值不一定是度量,比如订单ID,虽然是数值,但是不是度量而是维度,而时间、文本类的数据都是维度。
有一点需要格外注意,维度和度量是可以转换的。比如要看&年龄&的平均数,这里的&年龄&就是度量,要看19岁用户的订单情况,这里的&年龄&就是维度。对于一个数据项而言,到底它是维度还是度量,是根据用户的需求而定的,很像量子效应,状态只有需求确定后才会随之确定。
另外,维度可以衍生出新的维度和度量,比如用&地区&维度衍生出一个大区维度,&北京&、&天津&都对应&华北大区&,或者用&年龄&维度衍生出一个年龄范围维度,20到29岁=&青年人&,30到39岁=&中年人&,40到49岁=&资深中年人&。再比如上述的平均年龄,就是用&年龄&维度衍生出一个度量。
度量也可以衍生出新的维度和度量,比如用&订单金额&度量衍生出一个金额范围维度,100元以下对应&小额订单&,500元以上对应&大额订单&等等。再比如用&收入&度量和&成本&度量相减,可以得到一个&利润&度量。
2)做判断用对比
下面提出一个问题:企业A今年收入8000万,是高还是低?大家看着这个问题,应该会感到无从判断,因为没有参照物,即没有对比。因此,拿到一个数据,要判断是好是坏是高是低,必须要进行对比。
首先,企业A可以跟自己比。如果前年收入2000万,去年收入4000万,那今年8000万算很好了。去年收入1个亿,今年8000万就是糟糕了。这叫纵向对比。
其次,企业A也可以跟其他人比。同行的几家竞争对手企业今年都收入几个亿,那企业A的8000万就不理想。这叫横向对比。
第三,企业A还可以对比不同的维度和度量。比如竞争对手都做全国市场,企业A只做山东市场。企业A在山东市场的收入比竞争对手在山东市场的收入高,那么就本地区而言,企业A做的更好,而放眼全国,企业A做的就有局限。比如如果竞争对手都做了十几年,而企业A刚做四五年,那企业A就算做的不错,但如果成立的时间相仿的竞争对手已经过亿了,那企业A就算做的不够好。这叫综合对比。
孩子考试考了95分,家长很高兴,因为知道满分是100分,有参照物。最近一次考试考了80分,家长会发火,因为过去的95分成了新参照物。后来一问,发现这次卷子出难了,孩子已经是班级第一了,就又转怒为喜,这里其他孩子就成了参(xi)照(sheng)物(pin)。
对比的参照物不同,得到的判断结论也就不同。为了避免结论片面、不客观,应该尽量多用综合对比。
3)找原因用细分
今年利润下降了,老板很生气,下令查找原因,缉拿&嫌犯&。原因怎么找呢?注意是找原因,不是找理由。很多人往往不知道如何查找原因,最后给出的都是理由。
先看一个示例的原因结论是什么&&&因为四季度华南区域洗衣机的销量下降了,导致了今年利润的下降&。让我们分析一下这个原因有什么特点。
我们会发现,这个原因是由时间、区域、产品这三个维度和销量这一个度量组成的,于是我们可以知道,对于问题原因的查找定位,本质上就是在回答哪些维度下的哪些度量的下降或上升,导致了问题的发生。
这就是在做细分。
我们可以按维度细分,有多少维度,就可以有多少种细分的方向。比如看是去年所有月份都下降了,还是只有某几个月下降。如果是后者,那么就可以缩小查找的数据范围。聚焦到这几个月后,可以再看是哪些区域下降了,进一步细分。
入手的维度的先后顺序影响不大,问题原因涉及的维度也无法预知,因此可以从任意一个维度作为入口开始进行细分。
如果出问题的指标有相关的先导指标,则要想进一步挖掘问题原因,细分后还要看不同的度量,比如上述的原因结论示例是&因为四季度华南区域洗衣机的销量下降了,导致了今年利润的下降&,问题是&利润&而原因是&销量&,因为利润是通过别的度量计算衍生出来的。
细分无止境,细到什么地步才够呢?答案是,到可操作的区间才够。
比如就细分到&四季度利润下降,其它季度没有下降&,还是没有解决问题的办法,必须细到哪个时间段哪个区域哪条产品线,直到细到某一个最终责任人,才具有可操作性。需要注意的是,在真实情况中,问题往往不一定只有一个原因,而是多个原因综合起来形成的。
我司永洪科技主推的一站式大数据分析平台软件,为什么提供&缩放&和&笔刷&两种交互操作,就是为了满足&对比&和&细分&两种场景。
举一个例子,如下图,左图是各产品的收入毛利对比,右图是各品类利润趋势,现在用户想聚焦到&花茶&品类下的三种产品上,看看它们的利润如何。
这时用户就可以使用&缩放&功能,圈选代表这3种产品的3根柱子,点击&缩放&按钮,这时左边图表只剩下这3种产品,而右边的利润趋势则显示这3个产品的利润总和趋势。这就是在做&细分&。
有人可能会问,这个效果很类似筛选,为什么不在旁边放一些筛选器来实现呢?筛选器可以有,但现实情况中,当我们在一个图表上发现问题,不一定就能很容易地找到与其对应的筛选条件,尤其是散点图。因此,直接在图表上选择会非常方便高效。
再举一个例子,下图是产品利润趋势分析,用户发现从2009年7月开始,利润有连续4个月的下滑(如红框所示),用户想知道为什么。
这时用户就可以使用&笔刷&功能,在趋势图上选中这4个月的点,点击&笔刷&按钮,同一报告页面的其他图表就会淡化,然后突出显示用户选中的7到10月在这个图表上的占比,所以下图中左边的图表高亮显示出的矮的绿柱子,就是这些产品在这4个月的销售收入。
与&缩放&不同,&笔刷&方便用户将局部数据和整体数据进行对比。因为在上面这个例子中,单纯看哪些产品这4个月销售收入的绝对值低,并不能说明什么,有些产品本来卖的就少,一定要看哪些产品在这4个月相对表现不好。
先判断数据好不好,再分析原因是什么,数据分析的环节链条基本就算完整了。
2、怎么看待机器学习/数据挖掘等这类高大上的东东
什么时候去碰机器学习/数据挖掘这样高大上的东东。一句话,先把上述的数据发分析方法做到游刃有余,再搞那些高大上的。不要迷信复杂的算法,很多企业内部数据分析的大拿,往往都是深度理解业务,用的都是普通的计算方法,就能完成很精彩实用的分析过程。
机器学习/数据挖掘等什么时候会用到?简单而言,数据项多到人眼看不过来的时候会用到。如果总共就十来个数据项,每个拿出来单独出张图看一眼就看出端倪了,其实就不太需要用挖掘算法。如果总共几百个数据项,想看某一个数据项是受哪几个数据项影响最大,人眼看不过来,用挖掘算法就比较合适。
敬请期待笔者后续将写成的几篇文章:
《大道至简的数据治理方法论》
《大道至简的数据体系构建方法论》
《大道至简的深度分析方法论》
作者简介:王桐,永洪科技副总裁,北京航空航天大学工学硕士,拥有8年商业智能领域的产品销售、市场营销经验,此前效力于甲骨文和IBM。本文为作者授权创业邦发布,转载请注明作者信息及来源,违者必究
24小时报不停
Intel以11.4亿收购Replay,想让你360°看科比射绝杀
如你所想,薛蛮子投资了一家情趣用品商
暴风科技布局影视内容,刘诗诗赵丽颖套现2.26亿元
在印度仅排第七的小米,准备把注押在电商上
数字货币风光不再,微软停止接受比特币支付
中移动大规模关停3G基站?回应:个别行为
去哪儿被南航要求下架所有南航机票,封杀遭进一步升级
继国航、海航之后,南航从去哪儿网全线下架
俄罗斯裁定Android垄断,谷歌必须接受罚款
小米运动2.0版明天正式发布,UI有所调整
AlphaGo因输棋登上世界职业围棋排名榜:排第四
不是1000万,王健林诉微信公众号侵权案一审获赔7.5万元
暴风科技进军游戏、影视、海外三大业务!
阿里巴巴启动最多40亿美元子弹式贷款案
多牛传媒登陆新三板,成传媒大数据第一股
百姓网新三板挂牌上市,成国内分类信息第一股
周杰伦将加盟唯品会,出任首席惊喜官
医美App新氧获5000万美金C轮融资,估值追平春雨医生
神州租车股权重组:神州专车成最大股东,持股29%
马云:阿里打假投入不封顶,打假进人无上限
菜鸟网络完成首轮超百亿融资,估值近500亿
震惊!写稿机器人仅用0.3秒写完一篇股市新闻
优客工场宣布完成约2亿人民币A+轮融资,估值40亿
乐客VR宣布获A+轮2500万融资,已与HTC达成合作
美业移动SAAS美丽加获6000万元A轮融资
河狸家进行新一轮融,雕爷再讽58到家美甲没戏
Facebook前总裁:与明星和媒体的联系是Twitter最大弱点
董明珠:成龙代言的企业都死了,但格力没死
扬州软件园-Firefly北京众创空间开幕,主打双城共享
好大夫在线被曝医生收礼,微信关注变相要红包
AlphaGo因输棋获世界第四排名:公开叫板柯洁
英国将于明年在高速公路测试无人驾驶汽车
优客工场获A+轮约2亿元融资,估值近40亿元
Facebook与Snapchat较量不止,紧张关系加剧
苹果高价模式崩溃:6S销量下滑5S热销不止,都是价格惹的
依法办理“e租宝”案写入最高检工作报告
扎克伯格:虚拟现实革命将比想象中更早到来
AlphaGo之父:李世石78步点中了电脑“bug”
AlphaGo出现漏洞!李世石为人类扳回一城
百度视频指责优酷土豆恶意诽谤及专利侵权
医美O2O平台新氧获腾讯C轮投资,两年积累了1000万活跃用户
库克摊上事儿了:美国佛州警长称,如果苹果不配合将逮捕他
苹果4英寸iPhone将助智能手机出货量重拾升势
中国移动关闭TD基站,国产3G数千亿投资打了水漂
去哪儿反思被航空公司封杀:加强代理商监督
白岩松:阿法狗才代表人类,这是智力的胜利
俞敏洪:天使投资发展相对滞后主要是因为这些原因
马化腾:IP开发是大势所趋
苏宁控股董事长张近东:释放消费的潜力做数据分析不得不看的书有哪些?
1.不只是电商的数据分析。2.数据分析的基础不只是数据仓库3.为什么没有相关的数学方面的书的推荐?如:AndersonT.W. An introduction to multivariate statistical analysis, Wiley,195----------------------推荐书目:1、《统计与真理——怎样运用偶然性》 2、Google Analytic经典分析 3、统计学:从数据到结论(吴喜之)第二版 4、统计数据标准化方法 补充几本书:1、统计学的世界2、民生数据的真相3、统计陷阱
按投票排序
热诚推荐看过的几本经典。《Head First Data Analysis》链接:电子工业出版社的经典书目系列,从数据分析基本步骤开始、实验方法、最优化方法、假设检验方法、贝叶斯统计方法、主观概率法、启发法、直方图法、回归法、误差处理、相关数据库、数据整理技巧一一讲到。图比较多,适合入门。《Head First Statistics》链接:推荐理由同上,适合入门者的经典教材。《R in Action-Data Analysis and Graphics with R》链接:R是属于GNU系统的一个自由、免费、源代码开放的软件,用于统计计算和统计制图。这本书从实用的统计研究角度逐例分析R在数据处理、模型构建、以及图形操作上的由浅入深的结合,堪称经典。《数据之魅-基于开源工具的数据分析》链接:作者是华盛顿大学理论物理学博士。这本书是数据分析的经典之一,包含大量的R语言模拟过程及结果展示,例举了很多数据分析实例和代码。《数据挖掘-市场营销、销售与客户关系管理领域应用》链接:作者是Data Miners的创办人,有二十多年的营销和客户关系管理结合数据挖掘的经验。详细介绍了作为一个数据挖掘团队需要的知识体系,包括数据库、SAS使用、统计学、机器学习、数据可视化、如何访问用户收集需求、如何写论文与沟通等等。有条件的建议看英文原版。先把这些花时间啃啃,数据分析的理论部分就基本入门了,根据实际情况还需要结合你的业务需求来进行系统的学习。以上,有时间再来更新。
update 一本:《Introduction to Machine Learning, Second Edition》主頁:附:。 推荐一本不错的理论书:《The elements of statistical learning: data mining, inference, and prediction》主頁:附:。再有就是
提到的那本《Pattern recognition and Machine Learning》。本想讃,原來三年前就讃過了呢。那就來補充下鏈接好了。主頁:附:。這三本均為學術經典值得擁有。也不知道為什麼最近「大數據」各種火熱,那就另外再 update 一本,吧:《Mining of Massive Datasets》(相比大啊小的什麼,還是更喜歡這個叫法呢。哈哈。)主頁:附:。
数据分析的基础是统计学,复杂点的理论是数据挖掘,这两个是基础,是分析过程中使用的工具而已,个人能力的提升并不能体现在这两个方面的知识有精通,更重要的是个人思维以及与别人沟通展示自己的想法。这两个基础可以推荐两本书,《爱上统计学》,《数据挖掘概念与技术》,需要了解出现什么问题,用什么方法能解决即可。
思维方面的书推荐:《批判性思维》,《黑天鹅》,《数据会撒谎》,《博弈论》,《麦肯锡方法》《思考的技术》等等
数据展示方面:《用图表说话》,《excel演绎之道》,《演示之禅》,《餐巾纸的背面》,《视觉化思维》
数据分析与产品运营是离不开的,为此多学习产品、营销方面的知识是有利无弊的。
说实话,干互联网那么久,没有看过网站分析方面特别好的中文书,给楼主一些链接吧,里面有一些清单:
中文的补充一本
《精通Web Analytics 2.0——用户中心科学与在线统计艺术》
以网站分析为主,作者是Avinash Kaushik,译者是郑海平,邓天卓,两位作者是国内网站分析领域比较有经验的牛人,翻译是比较专业的。
附录:网站分析可以读的几本书(但是千万不要扎进去爬不出来了!)
  全部是英文的
1. Sybex – Advanced Web Metrics with Google Analytics. Mar 2008。虽然是2008年的书,但是里面有一些关于网站分析的基本实现方法和网站分析工具的基本原理,值得一读。如果你觉得学习了GCU还不过瘾,那么你也可以通读这本书。
2. Google Analytics by Justin Cutroni (O'Reilly shortcuts)。这本书不错,内容精练,可以全部读完。
3. Wiley-Web Analytics For Dummies (2007)。 闲得无聊可以翻翻。
4. Avinas的两本,读英文版的。不过,不建议初学者读。
5. Sybex – Landing Page Optimization – The Definitive Guide to Testing and Tuning for Conversions – Jan 2008。值得读,随便翻阅,会有收获。
6. Don’t make me think,跟网站分析不直接相关,但值得读。
纯数据分析和数据挖掘方面的,下面2本偏理论的,属于“道”这个层面,适合有几年工作经验以后再看
数据仓库(原书第4版)
数据挖掘概念与技术(原书第2版)
偏工具使用的,SAS和SPSS的书,市面上很多,说实话,都是把帮助文件翻译成中文,加一些实验示例,只能让你会使用工具,让你入门,至于说提高,主要靠工作经验的积累。
一直在自学和用数据挖掘的东西。因为不是本专业,所以随便讨论一下,仅作参考。补充一下我了解的数据挖掘经典教材,1《数据挖掘概念与技术》,作者:[加]Jiawei Han/Micheline Kamber 译: 范明/孟小峰 等2《数据挖掘导论》,作者: [美]Pang-Ning Tan,Michael Steinbach,Vipin Kumar 著3《数据挖掘技术——市场营销、销售与客户关系管理领域应用》作者: (美)贝瑞(Berry.M.J.A.),(美)莱诺夫(Linoff.G.S.) 著,别荣芳,尹静,邓六爱 译
三本都有中文版,前两本范明教授的翻译看起来不流畅,可能的话还是去看英文原版。相关的数学知识模型,主要应该是多元统计方面的。有的学校只用自己的影印版书做教材。可参考英文书很多,就不一一列举。中文的可以看清华的《实用多元统计分析》的确,数据挖掘不只是电商的数据分析,也不只是数据仓库,学术型的讨论更多在各种模型,如:分类、回归预测、相关性分析等。如果要做模型做得实用可行,一是用更高级更复杂的模型,本科教材级别的估计不够;二是更巧妙地定义问题、简化问题。不过无论怎样,只要能解决问题,就是好方法。
我觉得数据分析是个杂家,什么要懂一些,我概括起来包括4个方面的。1)数据处理能力,就是能数据库中的数据组织成你想要的形式。这里面最基本的就是EXCEL能力(你别小看EXCEL,EXCEL用活了也很牛逼的),再高级一点的数据库操作技巧(比如:编写T-SQL代码的技巧,再或者用第三方软件处理,比如SAS等),再牛一些就是能用编写一些脚本语言处理数据,比如python等。另外就是数据库语言SQL也是分析师的最基本能力。2)建立模型的能力,这个不光是能在一些软件是摆弄一些组件或方法,最关键的是要知道一些模型的适用原则和结果解释。在我们用的比较常见有比如logist回归,K-mean等,以及其他一些线性模型。这些模型的算法一般都不需要你写了,通过SAS等软件能自动实现,但是对很多并不了解的这些模型的基本原理,稀里糊涂做了。这里我建议你读一些数据挖掘技术和统计方法的书。此外,我要强调的是数据分析是为了解决问题,不要为了分析而分析。看过不少人,做了不少模型,但那些模型一定用处都没有,或者不需要模型就能解决问题。当然,如果你能自己写一些算法最好了,比如一些推荐算法等。3)数据分析是杂家,需要你去了解很多管理和经济学方面的知识。有了这些知识对你了解事物,结构问题很有帮助,比如你了解了营销理论后你对用户细分、用户行为以及渠道分析就很有感觉了。数据分析最重要就是思路,而思路往往来自于这些管理和经济方面的知识,数据分析的模型只是让你将这些思路简化和处理的手段而已。这就说明为什么很多做数据分析咨询方面的很多人来自MBA的原因。这个需要慢慢积累。4)对行业的认识,这个最容易入手,但也最难深入。如果一个人对行业一点了解,这个人不可能做好数据分析,他解决问题找不到关键点。此外,对于增强行业的认识我觉得没有什么太好办法,能做的就是时间对上去,慢慢了解这个产业链。这里我觉得有一些波士顿和波特的书就蛮好的
号新增书籍已近在下方显示,请查看!-----------------------------------号我和几个英国的朋友开的微信公众账号,为大家分享学习数据分析的方法和书籍。欢迎添加:soton2014sky扫扫二维码,添加账号——————————————————————————————————————————————————————————————————————————————————————号没想到会有这么多的朋友联系我,真的很意外,也很感谢各位的信任。我自己也决定不断的跟新书籍内容,给大家带来更多的最新知识。。。。。。————————————————————————————————————————————————————————————————————————————————————很多人都问过我这样一个问题: 作为一个文科生,你是怎么学习数据分析的?这个问题其实很好回答,一是兴趣,二是需求。 我本科学的是市场营销,硕士学的时数据挖掘。其实我个人觉得,大数据时代下的市场营销越来越离不开数据分析。以上都是废话! 下面是干货!我讲数据分析分为四个主要部分和一个额外部分,请看下图:这是我给所有新人第一次接触数据分析同学的建议。 任何一门知识的学习都是循序渐进,有由简入难。
下面是我针对每一个部分给出的详细书单。在给出书单前我(想说几句:这是我给所有新人第一次接触数据分析同学的建议。 任何一门知识的学习都是循序渐进,有由简入难。
下面是我针对每一个部分给出的详细书单。在给出书单前我(想说几句:书籍大部分都是全英文版本的,只有少量趣味书籍是中文的(因为中文书籍优秀的真的不多)。 至于为什么要用全英文,我会在下面给出一些简单的说明核心篇是最最最最最重要的,你可能需要看两遍,三遍,甚至四遍,五遍。。。在以后的中级或者高级学习中,你还需要不断的回顾核心篇内容!我本人至少看了有10遍,现在有时还是需要回到书本当中翻阅。中级篇当初我首先推荐R。原因很多,我就只说一个:免费为什么要用英文呢? 我用几句最简单的话来说一下原因(原谅我中文不好,说不出高大上的原因)。请看图:下面请看书单:核心篇新手篇:中级篇:三个部分中级篇:三个部分第一部分: SAS第二部分: SPSS第二部分: SPSS第三部分: R第三部分: R高级篇: 走到这里,实属不容易。原本我想继续推荐书籍,可是我发现当大家真的走到高级这一步的时候,其实已经不需要书籍的引导了。 虽然如此,我还是强烈推荐一本书:又是WIELY 出品,质量不用怀疑。我可以担保,如果你真的能弄清楚这本书上的每一个模块,那么数据挖掘建模你基本上已经搞定了。额外:这是针对网页分析的,我只推荐三本书: 作者Avinash Kaushik,请大家谷歌一下,然后看一下右面的介绍就OK。 文字形容这个家伙都是多余的,曾经来我们学校开讲座的时候,队伍是排到酒吧门口的(校园的酒吧)。书籍就这么多。
当然,还有更多经典的书籍值得我们学习,但是每个人的时间是有限的。比如说R,我觉得这方面的资料和书籍你这辈子也看不完, 我推荐的R in action, 大家可以去看看评价(请记住: 我说的是英文)。
我觉得,学完知识最重要的还是要去不断的实践,不断的去思考。书看太多未必是好事,有时会迷失在一个理论里而走不出来,我当初学神经网络,差点把自己搞成神经病!!
上面所有的书籍我都有高清正版的PDF格式,本来是放在网盘共享的,可是被侵权删除了。 我也试过在某宝上卖过这些书,可是结果是“呵呵”。 很多书籍是我在英国购买或者专有账户下载的,中文书籍可能侵权,但是英文绝对没有侵权! 本来在欧洲,基本上主流教材都会有高清PDF格式供使用的。电子化书籍是一个大趋势,可是我们国内似乎还没有认识到这一点!
7月30 号修改好多同学私信我让我发份电子稿给他们,由于本人目前还在英国,电子邮件发送太慢。我分享到了Dropbox 给大家免费下载。 当然,我也把这些书籍都给了我一个做数据分析培训的同学,大家也可以去购买(有些专业书,也是我自己当年花钱购买的)。 两种方式,大家自己随意选择。8月8号修改好奇怪,我这个答案只有十几个赞,可是给我私信要书的朋友至少有50多个。。这是为什么。我分享到dropbox供大家免费下载了,可是很多朋友说下载出现问题,我也不知道怎么回事。索性我就挂某个网站上卖了,也就几十块钱,邮箱给大家。 我想正在想学东西的人不会在乎这几十块钱吧。 挂上去卖,一方面,我承认,赚点小钱,可是我真的想告诉你,你买一份的钱都不够我在这边吃一顿午饭的,所以赚钱不是目的,我不缺钱,就是图个新鲜。 二,通过卖出去这种方式,也是监督自己希望能够尽量回答大家提出的问题,毕竟人家花钱了。 三,我觉得只要你花钱了,你才会稍微爱惜一点这些资料,很多人下载书不是看的,是用来屯的,好像书下载号之后你就懂了一样。如果您觉得这几十块不能够激起你惜书之情,请联系我,价格随便您抬,我很乐意!!!号新增今天增加三本书籍,主要是针对火的不行的两门开源语言:R和PYTHON这本书也是我最近一直研读的书籍,作者是Pandas包的开发者,其对python的见解非常深厚。该书介绍了python中常用的几个数据分析包,学完这本书,基本上数据处理这一块你就能驾驭了!!这本书也是我最近一直研读的书籍,作者是Pandas包的开发者,其对python的见解非常深厚。该书介绍了python中常用的几个数据分析包,学完这本书,基本上数据处理这一块你就能驾驭了!!推荐指数:五星可视化是数据分析的一门艺术,在R语言里有一个神一样的包叫做ggplot2,其以绘图简单,优美,灵活,简称信达雅而出名,这也是我现在还继续使用的R的最主要的原因。 而这本书是绝对是市面上最好的学习ggplot的教材,大量的实战案例,让你学的根本就停不下来。推荐指数:四星大头系列的书在国内已经很流行了,这本书我依旧继承了大头特色,简单,生动。缺点还是那句话,废话有点多。推荐指数:三星
从业至今一直从事于互联网数据分析师这一职业,且较多精力都是致力于游戏行业的数据分析。一直以来经常被人问到:数据分析师到底是干什么的?你们能创造什么价值?刚开始的时候,每当被问到这种问题,一时语顿,还真不知道怎么去解答。但是随之从业时间的沉淀,感觉自己也有那么一丝觉悟。犹如练武之人,练久了,虽还不能打开任督二脉,但是气血确实旺盛了不少。只不过其中的来龙去脉还不能整理清晰道出个明白。今天尝试把其中整理一下思路给大家说说。请看:
书在这里,看官
没有什么书是不得不读了建议看经典书,多看,经典的书要时常读,放在手边
推荐一本《超级数字天才》里面基本上都是数据挖掘和数据分析的思想和思路,看过之后受益匪浅。
工具书没有绝对的好坏,关键是适合自己吸纳知识的方式,可以高效率的学习。思想性的和展示交流的应该多看看,因为很多做分析的不擅长将自己了解的东西告诉别人。展现交流思路方面推荐麦肯锡的 《用图表说话》,《演示之道》大数据集展现推荐一些数据可视化的书籍,例如《可视化数据挖掘》,《数据之美》这方面的书好像不太多。展示技巧方面:《excel图表之道》。思想性的《统计思想》《黑天鹅》。
1.首先要掌握基本的统计知识和原理,这方面的书籍推荐《菜鸟也会数据分析》;了解一些数据分析的基本内容和流程,体会之类的李航的《统计学习方法》:书不算厚,但都是干货!对于基本的统计知识和原理梳理得很好《统计数字会说谎(How to lie with statistics)》,了解统计的另一面,必看!韩家伟的那边《数据挖掘导论》2.心理学社会学营销学方面的书籍,推荐:首推 菲利普·科特勒的《营销管理》其次是
的《消费者行为学》还有就是经典的《乌合之众》3.工具类书籍Excel ,PPT,Word,三种基本office办公软件,别告诉我你已经很熟练了!如果你不服气的话,可以到Excel home 这个网站看看牛人是怎么用这三个软件的Excel home 网站出的一系列相关书籍 都是非常实用的书,强烈推荐之!!!4.其它的统计语言类和数据处理类书籍,,,后期补齐
199IT网站有一个读书频道,里面有一些数据分析、数据挖掘、消费者研究、新媒体类的图书。
Bishop, Pattern Recognition and Machine LearningManning, Raghaven, Schutz, Introduction to Information RetrievalJanert, Data Analysis with Open Source ToolsSegaran, Programming Collective IntelligenceHastie, Tibshirani, Friedman, The Elements of Statistical Learning
O'Reilly 社有一本《社交网站的数据挖掘与分析》红色的封面,好像是一只海狸?还是老鼠?以前写网站时看过,还不错。—————————回家找到了这本书。
"精通Web Analytics 2.0"这本好像最近经常被人推荐。
没有啥不得不看的吧,只有看了更好的。有一本:m.bishop 的 Pattern recognition and Machine Learning. 不错。比较深入浅出。
重温大学时的微积分、统计等教材,巩固基础;精选三本书,读透;
关注牛人的博客和微博。
推荐一本《数据之美》,里面的案例比较杂,覆盖数据分析的方方面面。
已有帐号?
社交帐号登录
无法登录?
社交帐号登录

我要回帖

更多关于 数据统计方法有哪些 的文章

 

随机推荐