数据分析 知乎-数据分析怎么样?

nihdff 2024-10-25 数据分析 39 views

扫一扫用手机浏览

文章目录 [+]

大家好,今天小编关注一个比较有意思的话题,就是关于数据分析 知乎的问题,于是小编就整理了2个相关介绍数据分析 知乎的解答,让我们一起看看吧。

数据分析 知乎-数据分析怎么样?
(图片来源网络,侵删)
  1. 自学数据分析需要看哪些书的?求推荐?
  2. 能简单通俗的解释一下什么是大数据吗?

自学数据分析需要看哪些书的?求推荐?

01 - 思路篇

《谁说菜鸟不会数据分析(入门篇)》《深入浅出数据分析》这两本。

现在这两本书应该也有新版了,当然也有很多其他优秀的入门书籍,在京东上搜“数据分析”,你会发现很多很多书,随便挑两本看完,你就算基本了解数据分析是干什么的了。当然,这个阶段不要求你弄懂所有的知识点,主要是了解分析流程与基本概念,之后遇到问题再回来翻翻就好。当年面试支付宝,就靠这两本书了:)

02 - 技能

技能相关的书籍买过很多,就挑记笔记比较多的吧

SQL:《零基础学SQL》

Python:《Python编程 从入门到实践

R语言:《R语言实战》

Excel:《数据图形化,分析更给力》

PPT:《PPT,要你好看》

逻辑表达:《金字塔原理》

03 - 业务理解篇

其实每个行业的业务入门书籍不同但是基本的商业知识要先了解下的。

了解商业模式套路:《商业模式新生代》

图形化思考,商业常识:《餐巾纸的背面》

数据分析行业的常识:《大数时代生活工作与思维的大变革》

总而言之,看完两本书,学会SQL、Excel、PPT, 就当入门了

还有关于数据分析进阶、数据产品等书单推荐,希望对你有帮助~

以上书单来自→书单来了:数据分析十年,我只推荐这些书

1、《谁说菜鸟不会数据分析》

是小蚊子数据分析团队的作品,适合入门。写作手法***用讲故事的方式,以平实的语言娓娓道来,不会吓到新入门的童鞋。

不过书籍中并不是所有知识都要着重看,看了就会发现,像水晶易表这种组件在实际工作中用的不多了。

而有些知识点比如数据清洗过程、SPSS、Excel都还是很有用的。工具篇也提及到了自动报表、Vba等工具的使用可以尝试一下。

2、深入浅出统计学、数据分析

写的比较有意思的两本书,可以通过《深入浅出统计学》回忆一下以前学过的统计学的基本知识,或者加深对某些概念的理解。

两本都是外国作者写的那种很厚的,很啰嗦的书。不过,对于入门者来说不至于会被某些“魔幻”化的传道授业者所吓倒。读《深入浅出数据分析》可以了解数据分析师的部分工作内容是怎样的。

3、《Excel这么用就对了》

在吧Excel摸摸熟,基本小数据都能搞定了。当如使用Excel貌似硬是靠实践,倒是用了一本书,不过是有关Vba的书籍。刚入门时候,不知道怎么搞,还以为要学好Vba。后来发现,Vba略懂宏的录制、代码修改基本就够日常工作用了。


能简单通俗的解释一下什么是大数据吗?

什么是大数据及应用?大数据即为海量数据。人类生活在三维空间中,一草一木,一山一水,人类活动的行为轨迹,都能用数据来表达。如企业的生产运营商品标准。***的管理决策消费者消费水平,消费习惯。地理环境的一条公路,一条河流等等。每方面都有每方面的大数据。每个行业都有每个行业的大数据。通过各企业,行业,社会主体等等数据的集成。形成了概念更大,更有价值的大数据流。通过宇宙万物是互联的原理。以及逻辑关系的分析。能够得到。关于社会治理,企业运营,个人服务的便捷可靠,真实的服务方案。一件事物的组成并非由单一因素组成。由多方组合或者协同完成的。一件衣服的完成,要有生产布料的厂家,制衣厂家,制扣厂家,制线厂家,设计方,工人加工等等环节组合而成。大数据也是如此。大数据应用也是如此。人类刚刚迈入数字经济时代。既为以数据为生产资料的时代。谁能掌握大数据以及大数据的应用?更好地服务于人类社会。谁就占据了未来财富以及地位的制高点。中国战略性新兴产业联盟河北唐冠众兴科技有限公司毕绍鹏回答

大数据,不仅仅是数据量大,同时在其他方面,也有一定的特点。

第一,大数据数据体量非常大,传统的单机存储系统,已经无法在存储这么大量的数据,此时需要用到分布式存储技术

第二,大数据的数据种类非常多,数据的格式也会变得复杂,比如数据种类有***、文档、图片、消息记录等等。

第三,大数据中潜藏着非常重要的价值,通过数据分析技术,对商业决策做出智能化以及数据化的支持

大数据最主要的功能,就是为公司上层提供商业化决策支持,让公司能够结合历史数据,往正确的方向发展。大数据技术主要分为两类:大数据计算和大数据存储。

大数据计算主要分为离线计算和实时计算,具体使用要看业务场景对于数据产出时延的要求

离线计算对于数据的产出会有一定的时延,具体时延可以是15分钟、小时或者天级别的。离线任务一般会对数据进行全局批计算,这一次运行完就运行完了,不会像实时计算那样,除非你自己停止实时任务,否则实时程序会一直运行。

实时计算数据是不断产生的,一般数据产出的延迟会很低,最多是秒级别的。比如我们的数据大屏、实时数据流的加工处理等,这些场景对于数据的产出的时延要求很低。

离线计算的话,一般对于数据的产出时延没有那么高的要求,只要数据最终产出即可,具体使用像现在很多公司离线业务报表。目前大多数公司离线计算引擎使用的是Hive或者Spark,实时计算引擎目前主要是Flink。

大数据存储需要数据分布式存储,单机不能够在存储这么多巨量数据

在传统的关系型数据库中,当一个表非常大时,会使用分库分表技术,将表分布式的存储在不同的机器上面。分库分表技术可以使用开源工具TDDL。

在非关系型NoSQL数据库中,一般最底层的文件存储系统可以选择HDFS。HDFS文件系统将文件按照块来进行存储,一个块的大小为128兆,同时每个块会存储三份,对数据进行容灾存储,即使其中一个块坏了,可以选择其他块进行数据恢复。

分布式数据库系统可以对数据表进行水平分割和垂直分割比如HBase数据库,水平分割使用的是Region,垂直分割则是使用的列族。

分布式数据存储技术,需要不同机器一起协同工作,每台机器存储整体数据的一个子集。在未来大数据时代,肯定都会使用分布式数据存储,分布式数据库,会成为大数据系统的标配。

我是Lake,专注大数据技术原理、人工智能、数据库技术、程序员经验分享,如果我的问答对你有帮助的话,希望你能点赞关注我,感谢。

我会持续大数据、数据库方面的内容,如果你有任何问题,也欢迎关注私信我,我会认真解答每一个问题。期待您的关注

到此,以上就是小编对于数据分析 知乎的问题就介绍到这了,希望介绍关于数据分析 知乎的2点解答对大家有用。

[免责声明]本文来源于网络,不代表本站立场,如转载内容涉及版权等问题,请联系邮箱:83115484@qq.com,我们会予以删除相关文章,保证您的权利。

转载请注明出处:http://www.dataocan.com/44146.html

相关文章

数据分析eviews(数据分析师证书怎么考)

怎么用Eviews进行数据分析呢? 打开电脑,找到桌面上的Eviews软件,设置工作文件,点击文件左上角——新建——工作文件,填写...

数据分析 2024-12-21 阅读1 评论0