字体
关灯
   存书签 书架管理 返回目录
    第411章 幻传承和创新(第 1/2 页)

    =本文内容纯属个人猜想,仅供参考=

    =增量数据卡尺和减量数据卡尺=

    增量数据和减量数据,本身就是一种源文件+增量和减量和修改数据日志的方式来记录。

    本身就是对数据的每一次改动和注释,都可追溯。

    比如:

    某地星期一,西红柿的售价是5元每斤;西瓜的售价是10元每斤;胡萝卜的售价是2元每斤。

    到了星期二,价格有所改变,西红柿变成了3元每斤(记为星期一西红柿价格-2元每斤=星期二西红柿价格);西瓜变成9元每斤(记为星期一西瓜价格-1元每斤=星期二西瓜价格);胡萝卜变成3元每斤(记为星期一胡萝卜价格+1元每斤=星期二胡萝卜价格)。

    也就是说,当一个大数据,只有一部分有改动,改动只要没有达到百分之五十兼或设定值,那么就只能以日志的方式来存储,避免需要两个三个数据库硬件,一个数据库硬件为源文件数据库,一个数据库硬件为日志改动数据库,还有一个数据库为结果数据库,当用源文件+日志=结果数据库的方式,把结果数据库作为源文件数据库,那么就能够当做新的源文件数据库,这对于不需要调用历史数据的数据库很方便,然而对于需要调用历史数据库的数据,就很成问题。

    特别是相互关联数据的调用,这也就导致一个包含100年时间1zb数据中,可能需要调用的,只是其中特定10年的1gb数据,这就导致了无端的解压缩过程中的硬件调用资源浪费,也就是非要把所有数据都解压缩成压缩前文件,才能应用,那么问题来了,物理考古学家,需要特定10年的物理当时的科研数据,生物考古学家,需要特定100年的生物当时的科研数据,古语言学家需要调用20年当时的语言数据,而物理数据包含在一个100年时间1zb数据中,生物数据包含在一个1000年1024zb数据中,语言数据包含在一个5000年4096zb数据中,怎么弄?

    全部都全网在单机,每个使用者对应一个超级电脑用于解压缩,然后索引需要用到的内容?

    70亿个使用者呢?是不是需要建造70亿个超级电脑硬件啊?

    -->>(第 1/2 页)(本章未完,请点击下一页继续阅读)
上一章 目录 下一页
最近更新 晋末长剑 大清要完 骗了康熙 三国模拟器:这个马谡太稳健了 某霍格沃茨的魔文教授 谍影:命令与征服 我在现代留过学 活埋大清朝 我的谍战岁月 不是吧君子也防 大唐腾飞之路 寒门崛起 万历明君 红楼琏二爷 机战:先驱者的归来 大明烟火 说好的文弱谋士,你一人战三英? 蜀汉之庄稼汉 机战之无限边境 北齐怪谈
最多阅读 民国之文豪崛起 穿成反派总裁小情人[娱乐圈] 江湖三女侠 穿书之女配的分手日常 万历明君 穿越兽世当神棍 晋末长剑 机战之无限边境 北齐怪谈 我舍友变成美少女了 斗罗:从俘获教皇比比东开始 大清要完 星海王座 冠军请留步 三国之暴君颜良 沉溺 小老板 秘密部队之龙焱 唐朝从当村长开始 大唐:长乐赖在我家不走了