谷歌数据中心自行研发的软件技术:
1、GFS:分布式文件系统。
2、MapReduce:并行计算的核心技术框架。
3、BigTable:分布式的、稀疏的、多维的、易于扩展的、适用于海量数据的数据库。
谷歌数据中心的四个主要技术:
1、基于Map Reduce,Google的传统应用包括数据存储、数据分析、日志分析、搜索质量以及其他数据分析应用。
2、基于Dremel系统, Google推出其强大的数据分析软件和服务 — BigQuery,它也是Google自己使用的互联网检索服务的一部分。Google已经开始销售在线数据分析服务,试图与市场上类似亚马逊网络服务(Amazon Web Services)这样的企业云计算服务竞争。这个服务,能帮助企业用户在数秒内完成万亿字节的扫描。
3、基于搜索统计算法,Google推出搜索引擎的输写纠错、统计型机器翻译等服务。
4、Google Instant。输入关键词的过程,Google Instant 会边打边预测可能的搜索结果。
谷歌的大数据平台架构仍在演进中,追去的目标是更大数据集、更快、更准确的分析和计算。这将进一步引领大数据技术发展的方向。