大数据

  • 京东统一存储实践

    随着大数据时代的到来,海量数据的存储与处理成为了众多企业面临的重要挑战。HDFS 作为一个高可靠性、高扩展性的分布式文件系统,在京东零售的数据管理中扮演着重要角色。本文将分享京东在 HDFS 统一存储方面的实践经验,并对相关的技术细节进行总结。

    2024年5月29日
    13.1K00
  • 腾讯大数据多引擎统一元数据和权限管理的探索

    本文介绍了腾讯大数据多引擎统一元数据和权限管理的探索。TBDS的全称是腾讯大数据处理套件,它是一个基于 Hadoop 生态以及 MPP 生态的大数据平台。

    2024年5月23日
    30.1K00
  • 有效的数据治理如何推动业务增长

    数据治理显得尤为重要,它确保了企业内数据的有效和高效管理。数据治理的核心目标是确保数据在其生命周期内,从获取到使用,都以支持企业业务目标的方式进行管理。

    2024年5月22日
    35.3K00
  • 十分钟了解Flink SQL使用

    本文将介绍Flink SQL的基本原理、使用方法、流批统一,并通过几个例子进行实践。

    2024年5月13日
    20.8K00
  • 大数据管理的应用与实践

    大数据管理是指企业在其整个生命周期中处理的大量数据的治理、管理和组织,包括数据的摄取、处理、存储和分析,以推动决策并保持运营顺利运行。

    2024年5月10日
    32.9K00
  • 现实生活中的十大大数据应用

    大数据方法的使用使来自不同行业的众多企业受益,包括医疗保健、银行、制造业等在内的许多行业都在使用大数据分析。本文将深入探讨现实生活中对我们日常生活产生深远影响的十大大数据应用。

    2024年5月9日
    34.9K00
  • 算法在 58 画像平台建设中的应用

    用户画像平台是企业应用大数据的根基,精准营销、精细化运营和个性化推荐都离不开用户画像的建设。精准地刻画用户行为、兴趣以及需求尤为重要。本文将探讨算法在 58 用户画像平台建设中的作用,包括画像标签体系的建设,个性化推荐、精细化运营等业务应用。

    2024年5月9日
    14.2K00
  • 探讨供应链管理中的大数据分析

    在当今快速发展和相互关联的世界中,供应链管理在各行业企业的成功中发挥着关键作用。随着大数据分析的出现,各组织现在能够利用数据的力量来优化其供应链运营、提高效率、降低成本,并提高整体业绩。

    2024年5月8日
    6.2K00
  • 重新思考大数据以及业务运营和数据运营之间的脱节

    数据是铺就AI价值之路的水泥。“大数据”是一个关键领域,存在被错误归类的风险——这是过去的事情,或者缺乏值得一试的上行空间。CIO和数字高管需要确保大数据得到应有的关注。

    2024年5月8日
    19.5K00
  • 基于SpringBoot3.x和Apache Doris构建高效大数据分析系统

    在传统数据处理过程中,我们面临的数据多数是结构化的,该数据保存在预定义的数据模型中,如关系型数据库的表。然而,随着科技发展,尤其是互联网、物联网和移动设备的普及,非结构化数据(如文本、图片、音频、视频、社交媒体数据等)的产生量正在急剧增加,它们共同构成了大数据的特征--多样性。

    2024年5月7日
    13.9K00
  • vivo 超大数据规模分布式消息中间件架构演进实践

    新一代数据架构覆盖数据全链路,包括数据的采集层、接入层,以及下游的海量计算、分布式存储等。本次分享题目为 vivo 超大数据规模分布式消息中间件架构演进实践。

    2024年5月7日
    14.7K00
  • 大数据和人工智能是如何合作的?

    大数据的特点是产生的数据量大、种类多、速度快,为人工智能算法提供了提取有价值见解和推动明智决策的原材料。总之,这两种变革性技术有可能彻底改变全球的行业。让我们更深入地了解大数据和人工智能如何合作,以及释放其全部潜力的策略。

    2024年5月7日
    14.4K00
  • SpringBatch高阶应用:大数据批处理框架实战指南

    配置Job,Job是封装整个批处理流程的实体。在 Spring Batch 中,Job只是Step实例的容器。它将逻辑上属于一个流程的多个步骤组合在一起,并允许对所有步骤的全局属性(如可重启性)进行配置。

    2024年5月6日
    47.8K00
  • 蚂蚁集团 EB 级大数据治理架构与实践

    本文将分享蚂蚁集团在大数据治理实践过程中沉淀的经验。蚂蚁的数据来源众多,包括行为日志、系统服务端收集的数据等。从类型上看,有DB 类、日志类、log 类等,还有消息类的和非结构化的数据。

    2024年5月1日
    43.7K00
  • 大数据存储压缩算法调研:snappy、gzip还是lz4?

    压缩比是衡量压缩算法效率的重要指标之一,它表示压缩后的数据大小与原始数据大小之间的比率。一般来说,压缩比越高,表示压缩算法越有效,可以更好地减小数据存储空间或网络传输带宽的占用。

    2024年4月29日
    35.4K00

联系我们

在线咨询:1643011589-QQbutton

手机:13798586780

QQ/微信:1074760229

QQ群:551893940

工作时间:工作日9:00-18:00,节假日休息

关注微信