首页
编程日记
ChatGpt专题
LINUX学习
Java学习
前端教程
单片机
javascript
windows
计算机组成原理
Drawable
Pull APP
jstl
java加密算法
sqoop
Table API
角色
数据可视化
AI绘画 神经网络
电池
控制算法
类似LABVIEW
webrtc
最大降雨量
ts
正则
RE理论干扰源的分析
MPP
2024/4/12 12:02:45
手把手教你快速在生产环境搭建Doris集群
手把手教你快速在生产环境搭建Doris集群 一、部署规划 组件分布规划 节点node4node5node6node7node8Node9Node10Node11服务FE(follower)BEFE(follower)BEFE(follower)BEFE(observerÿ…
阅读更多...
Doris数仓开发规范
文章目录 一、字符集规范二、建表规范三、数据变更规范四、数据查询规范结尾 一、字符集规范 【强制】数据库字符集指定utf-8,并且只支持utf-8。 二、建表规范 【建议】库名统一使用小写方式,中间用下划线(_)分割,长…
阅读更多...
Doris集群的安装部署
目录 安装与部署 软硬件配置 1、机器选择 2、软件选择 3、环境信息修改和部署架构 4、安装部署Doris 5、启动FE 6、在FE节点启动MySQL客户端 7、在BE节点启动be 8、查看BE状态 8、查看FE状态是否正常 WEBUI 官方建议 安装与部署 该文档主要介绍了部署 Doris 所…
阅读更多...
Doris的基本概述
目录 Doris是什么 使用场景 技术概述 Doris是什么 由百度大数据部研发,之前加做百度palo,20118年共享到Apache社区后,更名Doris一个现代化的MPP分析型数据库产品 支持压秒级别响应架构非常简洁,易于运维支持10PB以上的超大数据…
阅读更多...
v851s MPP 模块概述以及编译 sample 步骤
1. MPP 模块概述 MPP 系统控制模块,根据芯片特性,完成硬件各个部件的复位、基本初始化工作,同时负责完成 MPP(Media Process Platform 媒体处理平台)系统各个业务模块的初始化、去初始化以及管MPP 系统各个业务模块的工作状态、提供当前 MPP 系统的版本信息等功能。 应用…
阅读更多...
【大数据 - Doris 实践】数据表的基本使用(二):数据划分
数据表的基本使用(二):数据划分 1.列定义2.分区与分桶2.1 Partition2.1.1 Range 分区2.1.2 List 分区 2.2 Bucket2.3 使用复合分区的场景 3.PROPERTIES3.1 replication_num3.2 storage_medium3.3 storage_cooldown_time 4.ENGINE 1.列定义 列…
阅读更多...
StarRocks案例7:使用shell批量broker load导入hdfs数据
文章目录 一. 问题描述二. 解决方案 一. 问题描述 近期需要进行补录数据,需要将hive的历史数据迁移到StarRocks,因为需要补录的数据较多,hive和StarRocks均使用的是分区表,两边的日期格式也不同,hive这边是 yyyymmdd格…
阅读更多...
跟 AI 学 StarRocks:简介
因为要支持公司的 BI 建设,团队引入了 StarRocks 数据库,此前我没有了解过此项技术,不过因为有架构师引入了此项技术栈,就顺便学习一下。 一、什么是 MPP 数据库? MPP 数据库指的是大规模并行处理(Massiv…
阅读更多...
【大数据】Doris 架构
Doris 架构 Doris 的架构很简洁,只设 FE(Frontend)、BE(Backend)两种角色、两个进程,不依赖于外部组件,方便部署和运维,FE、BE 都可线性扩展。 ✅ Frontend(FE࿰…
阅读更多...
StarRocks案例5: hive外表报错starrocks [42000][1064] hdfsOpenFile failed
文章目录 一. 问题描述二. 解决方案 一. 问题描述 StarRocks版本 2.5.5 现在需要使用hive外表,然后根据官网的的命令创建了hive resource CREATE EXTERNAL RESOURCE “hive0” PROPERTIES ( “type” “hive”, “hive.metastore.uris” “thrift://myhadoop:90…
阅读更多...
【大话Presto 】- 核心概念
文章目录 前言Operator Model And Iterator Model系统组成Connector数据模型查询执行模型StatementStageTaskSplitDriverOperatorExchangePipeLine 总结 前言 Presto(PrestoDB)是一个FaceBook开源的分布式MPP SQL引擎,旨在处理大规模数据的查…
阅读更多...
每日一博 - MPP(Massively Parallel Processing,大规模并行处理)架构
文章目录 概述优点缺点小结 概述 MPP(Massively Parallel Processing,大规模并行处理)架构是一种常见的数据库系统架构,主要用于提高数据处理性能。它通过将多个单机数据库节点组成一个集群,实现数据的并行处理。 在 …
阅读更多...
什么是MPP数据库?
大规模并行分析(MPP)数据库(Analytical Massively Parallel Processing (MPP) Databases)是针对分析工作负载进行了优化的数据库:聚合和处理大型数据集。MPP数据库往往是列式的,因此MPP数据库通常将每一列存…
阅读更多...