首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

#hive

Apache Hive是一个建立在Hadoop架构之上的数据仓库。它能够提供数据的精炼,查询和分析。

0924-Hive on Tez性能调优

Fayson

2.如果 hive.tez.auto.reducer.parallelism 设置为 true,hive 会预估数据大小并设置预估的并行度,Tez会对sourc...

700

Hive 与 SQL 标准和主流 SQL DB 的语法区别

恋喵大鲤鱼

Hive是一种基于Hadoop的数据仓库软件,可以将结构化数据文件映射为一张数据库表,并提供了类SQL查询接口,使得用户可以使用SQL类语言来查询数据。Hive...

11710

0922-7.1.9-使用Spark和Hive访问Ozone

Fayson

8010

Hive 表定义主键约束

恋喵大鲤鱼

在 Hive 中,可以使用 PRIMARY KEY 子句来定义主键约束,以确保表中的每行数据都具有唯一标识。主键约束要求表中的每个行都必须具有唯一的主键值,这可...

15110

hive面试必备题

Spark学习技巧

环数科技有限公司 · 数据库开发工程师 (已认证)

Hive存储的是逻辑上的数据仓库信息,包括表的定义、数据的存储位置(HDFS路径)、分区和表的元数据等。实际的数据文件存储在HDFS上,Hive通过HQL(Hi...

11210

0916-5.16.2-如何将Hive元数据库从外部PostgreSQL转换到MySQL

Fayson

2.停止Hive服务,在配置中搜索“database”,修改数据库配置到MySQL库

9210

0914-7.1.7-如何用Doris创建Hive和Iceberg Catalog

Fayson

Doris支持多源数据目录(Multi-Catalog)功能,旨在能够更方便对接外部数据目录,以增强Doris的数据湖分析和联邦数据查询能力。Multi-Cat...

19310

Hive日志解析

用户7647874

日志中有sql提交用户:userName,还有提交主机:ipAddress,提交sql:insert overwrite into table XXXX sel...

9810

Hive 整体介绍

Freedom123

Hive可以管理HDFS中的数据,可以通过SQL语句可以实现与MapReduce类似的同能,因为Hive底层的实现就是通过调度MapReduce来实现的,只是进...

8410

Hive的简单操作

为了伟大的房产事业

Hive是Apache Hadoop生态系统中的一部分,它提供了一种方便的方式来处理和分析大规模数据。Hive将数据存储在Hadoop分布式文件系统(HDFS)...

7410

Hive基础知识07-求取中位数

数据仓库晨曦

中位数(Median)是描述一个数据集中心位置的统计量,它是将数据集从小到大排序后位于中间位置的数值。如果数据集中的元素数量是奇数,那么中位数就是正中间的那个数...

38010

hive数据定义语言DDL

h3110_w0r1d

显示hive中数据库的名称,注释(如果已经设置),及其在文件系统中的位置等信息

12110

Hive的安装和配置

h3110_w0r1d

```bash tar -zxvf apache-hive-3.1.1-bin.tar.gz -C /root/bigdata/

39910

梅开二度:我在VS Code上又写了一个Hive&Spark SQL的插件

泊浮目

一时半刻我看得眼花缭乱,不禁问他:难道没有什么好的工具可以统一编辑、format、校验语法错误的事吗?他告诉我没有,至少在免费软件里没有。 从那刻起,我诞生...

15610

深入理解Hive中的explode和posexplode函数

数据仓库晨曦

大家好,今天我将向大家介绍Hive中两个常用且强大的函数:explode和posexplode,它们在处理复杂的数据类型时有着不可替代的作用。下面我们就来一起看...

41210

深入理解Hive中的Lateral View及Lateral View Outer的用法

数据仓库晨曦

今天我想和大家分享一下在Hive中,Lateral View和Lateral View Outer的用法,这两者是在处理数据时经常遇到的操作。那么它们到底是什么...

46310

Hive-SQL查询每年总成绩都有所提升的学生

数据仓库晨曦

一张学生成绩表(student_scores),有year-学年,subject-课程,student-学生,score-分数这四个字段,请完成如下问题:

13510

hive开窗函数-row_number

数据仓库晨曦

Hive 中的 row_number 函数是一个非常有用的窗口函数,它会对查询结果进行编号,并按照指定的排序方式对这些编号进行排序。在本文中,我们将介绍 row...

38610

hive开窗函数-rank和dense_rank

数据仓库晨曦

当我们需要对数据进行排序时,eank和sense_rank是两个非常有用的函数。在此文章中,我将向您介绍这两个函数并提供详细的语法说明。

14710

hive开窗函数-lag和lead函数

数据仓库晨曦

在大数据分析中,时间序列数据非常常见。如何通过编程来处理这些数据呢?HiveSQL 提供了两个强大的窗口函数:lag() 和 lead()。它们可以帮助我们计算...

1.1K10
领券


http://www.vxiaotou.com