Python全系列 教程
3567个小节阅读:5931.9k
目录
鸿蒙应用开发
C语言快速入门
JAVA全系列 教程
面向对象的程序设计语言
Python全系列 教程
Python3.x版本,未来主流的版本
人工智能 教程
顺势而为,AI创新未来
大厂算法 教程
算法,程序员自我提升必经之路
C++ 教程
一门通用计算机编程语言
微服务 教程
目前业界流行的框架组合
web前端全系列 教程
通向WEB技术世界的钥匙
大数据全系列 教程
站在云端操控万千数据
AIGC全能工具班
A A
White Night
3.存储数据模型(重点)
1、文件线性切割成块(Block)(按字节切割)
xxxxxxxxxx
[root@node1 ~]# for i in `seq 100000`; do echo "hello gtjin $i" >> hello.txt; done
[root@node1 ~]# cat hello.txt
hello gtjin1
.....
hello gtjin100
......
2、Block分散存储在集群节点中
3、单一文件Block大小一致,文件与文件可以不一致
xxxxxxxxxx
hdfs dfs -D dfs.blocksize=1048576 -D dfs.replication=2 -put hello.txt /
4、Block可以设置副本数,副本分散在不同节点中
a) 副本数不要超过DataNode节点数量
b) 承担计算
c) 容错
5、文件上传可以设置Block大小和副本数
6、已上传的文件Block副本数可以调整,大小不变
7、只支持一次写入多次读取;对同一个文件,一个时刻只有一个写入者
8、可以append追加数据
4.优势(了解)