数据迷雾:洞察数据的价值与内涵mobi-epub-azw-pdf-txt-kindle电子书

书籍编码:3184
由于链接总是被和谐,需要本书电子版的朋友关注公众号:【互联网分享社区】(账号:hlwfxsq),首页回复数字3184 ,或者书名,自动弹出下载地址。

数据迷雾:洞察数据的价值与内涵mobi-epub-azw-pdf-txt-kindle电子书插图

 

作者: [美]杰森•辛克
出版社: 中国科学技术出版社
出版年: 2022-5

内容摘录

第4章
数据处理的最优策略
当分析数据时,我们最应牢记的便是必要、需求和有效。这也是我与客户分析股票市场以及在特殊项目中分享建模和预测结果时的经验。

而这所有一切,都始于有效的提问。

正确定义问题

在电影《银河系漫游指南》(The Hitchhiker’s Guide to the Galaxy)中,主角们向无所不知的名为“深思”(Deep Thought)的超级计算机寻求“生命、宇宙和万物的答案”,这是个宽泛且深奥的问题。

不久,他们再次见到“深思”时,它却只给出了“42”这一答案。

很显然,主角们问的不算是个“好问题”。如果没有找准问题,您自然也不会得到想要的答案。

没有优秀的命题,世界上所有的数据和计算能力都将一文不值。问题的有效性固然重要,与此同时,确保数据的有效性以及遵循正确的数据处理流程同样必不可少。

遵循数据处理流程

遵循适当的数据处理流程比以往任何时候都更加关键,原因有二:

首先,要记住所有项目都有两面:人的一面和技术的一面——从技术和流程的角度正确进行分析非常重要。

其次,产生和收集数据的速度正在加快。之前提到,过去两年中创建的数据占到了人类历史上所有数据的90%。也就是说,现在是科学家、工程师和企业利用这些数据来发挥自己优势的绝佳机会。但是,只有遵循流程,才能真正体现数据的力量,产生真实、有价值、可实践的结论。

无效的数据和混乱的流程管理带来的无数次失败,印证了为什么正确地管理数据收集和分析过程越来越重要:只有这样所有工作才能顺利地进行下去。只有这样您才能获得有效的结果,用以支持——当然也可能会证伪——您的假设。

确保自己一以贯之地遵循一套可靠的数据处理流程是获得最佳分析结果的关键。做好充分的准备,再付诸行动,您将节省宝贵的时间和精力。