HDFS的架构、原理和应用场景有哪些深入理解?
- 内容介绍
- 文章标签
- 相关推荐
本文共计713个文字,预计阅读时间需要3分钟。
HDFS设计原则:
1.非常大的文件:这里的非常大指的是几MB、GB、TB级别。
2.流式数据访问:基于一次写入多次读取。这里的非常大同样指的是几MB、GB、TB级别。Hadoop集群已可存储PB级数据。
hdfs设计原则1.非常大的文件这里的非常大是指几百MB,GB,TB.雅虎的hadoop集群已经可以存储PB级别的数据2.流式数据访问基于一次写这里的非常大是指几百MB,GB,TB.雅虎的hadoop集群已经可以存储PB级别的数据
2.流式数据访问
基于一次写多次读。
3.商用硬件
hdfs的高可用是用软件来解决因此不需要昂贵的硬件来保障高可用性各个生产商售卖的pc或者虚拟机即可。
hdfs不适用的场景 1.低延迟的数据访问 hdfs的强项在于大量的数据传输递延迟不适合他10毫秒以下的访问可以无视hdfs不过hbase可以弥补这个缺陷。 2.太多小文件 namenode节点在内存中hold住了整个文件系统的元数据因此文件的数量就会受到限制每个文件的元数据大约150字节 1百万个文件每个文件只占一个block那么就需要300MB内存。你的服务器可以hold住多少呢你可以自己算算 3.多处写和随机修改 目前还不支持多处写入以及通过偏移量随机修改 hdfs block 为了最小化查找时间比例hdfs的块要比磁盘的块大很多。
本文共计713个文字,预计阅读时间需要3分钟。
HDFS设计原则:
1.非常大的文件:这里的非常大指的是几MB、GB、TB级别。
2.流式数据访问:基于一次写入多次读取。这里的非常大同样指的是几MB、GB、TB级别。Hadoop集群已可存储PB级数据。
hdfs设计原则1.非常大的文件这里的非常大是指几百MB,GB,TB.雅虎的hadoop集群已经可以存储PB级别的数据2.流式数据访问基于一次写这里的非常大是指几百MB,GB,TB.雅虎的hadoop集群已经可以存储PB级别的数据
2.流式数据访问
基于一次写多次读。
3.商用硬件
hdfs的高可用是用软件来解决因此不需要昂贵的硬件来保障高可用性各个生产商售卖的pc或者虚拟机即可。

