数据分析
-
读时建模技术在异构数据分析平台的应用
本文将从日志分析的价值和日志处理的难点和挑战入手,进而引出读时建模的技术理念,并介绍鸿鹄数据分析平台在设计和技术实现的时候,是如何去考虑做读时建模的。希望为大家的日志相关处理平台选型提供一些新的思路。
-
数据收集和高级分析带给制造业的三大好处
制造商经常利用数字化策略提高自身竞争力,解决劳动力短缺问题,提高生产效率。这些努力是基于保持行业领先地位的愿景,而不单单是降低竞争力风险的措施。然而,收集数据会推动一波又一波的创新,以创造快速、大胆、有竞争力且灵巧的组织,实现降本增效。
-
数据信息汇总的七种基本技术总结
数据汇总是一个将原始数据简化为其主要成分或特征的过程,使其更容易理解、可视化和分析。本文介绍总结数据的七种重要方法,有助于理解数据实质的内容。
-
数据分析实战,用Python热力图分析房地产市场
地理热力图工具使我们能够直观地看到欧盟各地不良房地产的折扣情况。通过分析房地产数据并将其在地图上可视化,投资者能够确定折扣最高的地区,并优先在这些地区寻找不良房地产。这项技术帮助投资者发现了可能会错过的潜在投资机会。
-
Gartner发布2023年十大数据和分析趋势
Gartner近日公布了2023年十大数据和分析(D&A)趋势。
-
对于非结构化数据,EDA探索性数据分析该怎么做?
本文的讨论到此结束。当然,在EDA中还有很多技术比本文在这里介绍的要多得多,这取决于用户在问题陈述中要使用的数据集。
-
数据分析,根本没有你想的那么高级!
在数字化转型工作中,十分强调通过数据科学技术来发挥数据的价值,例如通过数据分析方法,从数据中提取出有价值的业务信息,以此来提供有效的业务应用或业务决策。在数字经济大趋势下,数据分析这件事,突然之间地位得到了前所未有的提升。
-
GPT会替代分析师吗?
数据分析中每一个细节都需要去从数据中探索寻找业务发生了什么?为什么发生?这种状况会持续多久?我能给出的方案是什么?如何来衡量价值呢?
-
详解基于凸集投影方法的聚类算法
聚类分析(或聚类)是一种数据分析技术,它能够探索和分组一组向量(或数据点),使同一聚类中的向量彼此之间比其他聚类中的向量更相似。聚类算法被广泛应用于例如数据分析、模式识别和图像处理等许多应用场景中。
-
数据分析在设施管理和维护运营中的作用
数据分析是一门分析和处理原始数据以获得有意义且可操作的见解的科学,这些见解可用于为业务决策提供信息。
-
数据分析在设施管理和维护操作中的作用
数据分析在设施管理软件中发挥着至关重要的作用,其提供了有价值的见解,并使企业能够优化设施性能、提高运营卓越性、加强资产管理和降低成本。
-
数据分析实战,用Pandas分析二手车市场行情
本文将展示如何从汽车销售商网站Cars24上抓取所有的搜索结果,并建立一个包含所有找到的列表的数据库。
-
为什么新兴的数据趋势需要一种全新的数据处理理念?
过去这几年,数据的创建和使用方式出现了一个微妙但明显的趋势。据IDC声称:“全球数据总量将从2018年的33 ZB猛增到2025年的175ZB,年复合增长率高达61%。”这在改变数据处理和分析方面的基本规则。 2021-03-29 08:00:00 数据分析工具架构 只有22%的人做对了这道数据分析题,你来试试吗? 认知偏见在日常活动中经常发生,本文提到的一道看似简单的思考题(在第03段),只有22%的人能做对。认知偏见可能导致错误的决策,数据分析和人工智能会帮你避免此类错误。本文将探索一些模式,利用数据洞察,帮助你做出更好的决策。 2021-03-28 23:32:28 数据分析人工智能技术 NameNode是用了什么神秘技术来支撑元数据百万并发读写的 我们都知道,HDFS 是大数据存储的基石,所有的离线数据都存储在 HDFS 上,而 NameNode 是存储所有元数据的地方(所谓元数据就是描述数据的数据,比如文件的大小,文件都存储在哪些 DataNode 上,文件在目录树的位置等),所以 NameNode 便成为了 HDFS 最关键的部分。 2021-03-28 22:46:52 NameNodeHDFS大数据 Java在大数据行业重要吗? 大数据时代,给想进入互联网行业的人才展现了新的发展机会,与此同时还提供了新的职业发展通道。
-
为什么数据专业人士需要投资数据治理计划?
美国德雷塞尔大学勒博商学院日前公布的一项数据管理调查报告发现,66%受访的数据和分析专业人员表示,在实施数据治理计划时将数据质量提高作为一个“主要优势”。对于已经拥有成熟数据治理框架的企业来说,这一趋势上升到了惊人的83%。 2021-12-21 13:58:53 大数据数据治理数据分析 协助税务局「逮住」薇娅的「税务大数据」,是什么? 据新华社消息,税务部门已对网络直播等新业态从业人员,给予了包容性的自查整改期,目前已有上千名主播主动自查补缴税款。税务局是如何发现这场重大偷逃税问题的?从监管部门的回复来看,税收大数据功不可没。 2021-12-21 10:53:34 大数据AI税务 论大数据时代个人信息的重要性 我们这个社会发展至今早已进入大数据快速发展的时代,涌现出各种新的平台,也让人们的生活变的丰富多彩,同时让更多的人都有发展的空间。但是我们在发展的同时也伴随着信息安全隐患,那么有哪些安全隐患呢? 2021-12-19 13:50:42 大数据信息安全隐私 手把手教你设计大数据流水线 本文介绍大数据流水线的标准工作流程,以及设计大数据架构流水线时需要考虑的各种工具和流程。 2021-12-17 18:21:54 大数据流水线设计 2025年我国大数据测算规模超3万亿 期待带来大市场 工信部日前发布《“十四五”大数据产业发展规划》,提出到2025年,我国大数据产业测算规模突破3万亿元,年均复合增长率保持25%左右,创新力强、附加值高、自主可控的现代化大数据产业体系基本形成。规划有什么亮点?如何补齐大数据产业发展短板? 2021-12-15 13:49:21 大数据数字化转型安全 伴鱼基于 Flink 构建数据集成平台的设计与实现 数据仓库有四个基本的特征:面向主题的、集成的、相对稳定的、反映历史变化的。其中数据集成是数据仓库构建的首要前提,指将多个分散的、异构的数据源整合在一起以便于后续的数据分析。
-
一学就会,一做就废!为什么数据分析上云这么难?
与传统的内部数据分析方式相比,将数据分析迁移到云端需要新的方法、技能和架构。 2021-07-29 10:26:34 数据分析上云CIO 分布式协调框架Zookeeper核心设计理解与实战 想起很久以前在某个客户现场,微服务 B 突然无法调用到微服务 A,为了使服务尽快正常恢复,重启了微服务 B 。虽然故障原因找到了,但对于 Zookeeper 的理解还是不够深刻,于是重新学习了 Zookeeper 的核心设计,并记录于此文共勉。 2021-07-29 07:48:36 Zookeeper 核心设计 用Pandas读取CSV,看这篇就够了 通过本文的介绍,我们了解了读取CSV文件的一些参数的功能,也了解了在读取CSV文件时可以做一些初步的数据整理工作。