如果考虑到云计算在全球范围内发展的方式,这些核心事实会更加复杂,从而导致我们将云功能的“实例”放置在地球上不同的数据中心中。再一次,我们面临着与时间和位置有关的数据分离问题,所有这些问题都会造成延迟,即在我们请求数据(或更经常地,我们的应用程序和数据库发出请求)之间以及我们何时真正能够得到它。
那么,现代的云原生软件应用程序开发和数据科学专业人员如何应对这一挑战?问题是,随着这些软件工程专业人员试图解决将应用程序扩展到新地区所使用的手动变通办法,他们常常会在此过程中造成性能问题。
云计算数据架构师用于处理现代数据访问和管理困境的一项关键技术是数据分区。这里的承诺和核心技术主张围绕以下建议:按位置划分数据可以使全球组织解决由分布式数据引起的延迟问题。
数据库管理系统公司蟑螂实验室的产品营销副总裁是吉姆·沃克。Walker提醒我们,IT延迟与最终用户对产品或服务的“体验”直接相关,他说,如今的企业必须能够实时接收、分析和处理数据,以提供最佳的用户体验。
“100ms(毫秒)规则是由Gmail的创建者paulbuchheit提出的,它指的是人的延迟阈值,在这个阈值中,交互感觉是即时的。超过100毫秒,我们人类开始发送一个时间延迟。从这个角度来看,信息从世界的一边传到另一边会增加大约250毫秒的延迟,而且只有在信息沿着最直接的路径移动的情况下,才会出现这种情况。不幸的是,数据不是直线传播的,所以服务器和网络用户之间的距离很重要,”Walker说。
数据在地球上跳跃
但距离并不是唯一的挑战。高速光可以在14毫秒内从纽约传输到旧金山(在真空中),但数据不能在真空中传输。它通过多个不同的网络设备传输,这些“跳和跳”也增加了延迟——传输100英里但跳5次的信息的延迟比只有两次跳的2500英里的请求要长。这意味着位置对于优化数据传输方式同样重要。
由于这些事实,Cockroach Labs的Walker坚持认为,位置必须成为我们考虑用于现代应用程序和开发人员的数据库的新驱动力和决定性载体。