Doris
-
基于Doris构建亿级数据实时数据分析系统
现有业务数据有以下特点,查询多、更新少,基本不会更新1 个月以前的数据,但是查询范围较大,有时需要查询几年前的数据,而且数据会以年、月等不同维度统计。
-
Doris到底有多牛,为什么大厂都在使用它?
Apache Doris源于百度2008年启动的产品Palo在2018年捐献给Apache基金会,是一个基于 MPP 架构的高性能、实时的分析型数据库,它非常简单易用,而且性能还不错,仅需亚秒级响应时间即可获得查询结果,不仅支持高并发的查询场景,也可以支持高吞吐的复杂分析场景,比如你可以基于它做用户行为分析、日志检索平台、用户画像分析、订单分析等应用。
-
基于Doris ,打造快速、安全、高可靠的实时数据仓库
分区和桶化的思想是将数据“切割”成较小的部分,以增加数据处理速度。关键是设置适当数量的数据分区和桶。根据使用情况,根据每个表自定义桶化字段和桶的数量。
-
从Clickhouse迁移到Doris,数据仓库性能大提升
本文分享如何从ClickHouse迁移到Doris的过程,包括为什么需要更改,需要注意什么以及如何比较两个数据库在各自环境中的性能。
-
更简洁更高效,Doris对比ClickHouse、MySQL、Presto、HBase
Apache Doris可以替代ClickHouse、MySQL、Presto和HBase,因为它在整个数据处理流程中具备全面的能力。
-
Doris新优化器背后的故事
所有使用数据库的同学都非常关心数据库对 SQL 有什么样的优化,这直接决定着查询的性能。这也是我们在优化器上持续不断地投入研发的根本原因。本文将分享 Doris 新优化器开发过程中的一些感悟。
-
十分钟掌握Doris,超越Hive、Elasticsearch和PostgreSQL
本文介绍Apache Doris作为数据仓库的升级,提高数据处理效率和查询能力。
-
Doris新优化器背后的故事
所有使用数据库的同学都非常关心数据库对 SQL 有什么样的优化,这直接决定着查询的性能。这也是我们在优化器上持续不断地投入研发的根本原因。本文将分享 Doris 新优化器开发过程中的一些感悟。
-
货拉拉大数据Doris稳定性保障实践
本文将介绍货拉拉大数据在Doris稳定性保障方面的实践。我们从2022年初开始使用Doris,在这一年半的时间里,Doris还是相对稳定的,同时提供了高性能的查询。上图右侧是Doris的整体架构图。Doris的数据源来自IOT、埋点和数据库,通过实时数仓和离线数仓两个方式写入。以Doris作为主引擎构建了大数据OLAP平台,服务于上层应用。
-
小米集团基于Apache Doris的OLAP实践
本文将分享小米集团基于Apache Doris的OLAP实践。文章将从小米集团OLAP系统的选型历史以及当前的应用现状入手,分享小米数据生态中的Doris以及Doris在小米用户行为分析场景的实践。
-
聊聊一种读取亿级Doris数据库的方法
如果数据量比较大,超过千万,甚至过亿,单节点读取会遇到超时以及时效过低的问题。可以使用spark.read.jdbc分布式多节点并发读取。spark读取支持两种方式。
-
Doris为什么那么快?
在绝大多数场景之中,用户只需要将session变量enable_vectorized_engine设置为true,则FE在进行查询规划时就会默认将SQL算子与SQL表达式转换为向量化的执行计划,从而提升SQL执行性能。
-
Doris数仓的4大特点,一篇讲明白
Doris是一款基于MPP技术的SQL分析型数据库系统,能够在海量数据的OLAP场景下提供毫秒级的查询响应性能。Doris的实现架构脱胎自Apache Impala和Google Mesa系统,并进行了大量的改造和优化,最终形成了今天大家看到的这款架构优雅、性能卓越、功能丰富、简单易用的OLAP数据库系统。
-
Apache Doris 极速数据湖分析技术细节公开!
本文将介绍 Apache Doris 的前世今生,数据湖分析的技术细节以及后期的规划。
-
Apache Doris刚“毕业”:为什么应关注这种SQL数据仓库?
Doris原名Palo,诞生于中国互联网搜索巨头百度,是其广告业务的数据仓库系统,2017 年开源,2018年进入Apache 孵化器。