过去十年引起广泛关注的数据模型是 MapReduce,但 MapReduce 不是一种具有普适性的架构。相反,MapReduce 市场已经转变为 HDFS 市场,并且似乎准备...
过去十年引起广泛关注的数据模型是 MapReduce,但 MapReduce 不是一种具有普适性的架构。相反,MapReduce 市场已经转变为 HDFS 市场,并且似乎准备...
知网 选择 English,论文会多很多,而且下载的事 PDF 版本 搜索 site:gov.cn 就只会显示 ZF 网站的结果Github 里的搜索,一定可以学一下,比如 ...
Google File System Big Table Map Reduce HDFS HBase Hadoop Hadoop 基于硬盘,可以处理海量数据; Spark 基...
文件结构目的:便于程序理解文件内容文件结构有无结构:文字流、字节流等简单记录结构:线性、固定长度、可变长度等复杂结构:格式化文档、多媒体文件等由操作系统、程序决定了文件结构 ...
kNN是一种聚类算法,python的代码分类器函数思路即读取的数据为一个inX=[x,y,z]inX的第一列向量重复成inX的同型矩阵(利用tile)[[x,y,z],[x,...
LDA理论 假设我们有m维样例 我们寻求一个标量y通过映射样本集x到一条线上 maximize样本类型分开的line 各个类型的点求他们的“均值点” 比如有A类型的 (1,2...
基本特征大的用户空间:给用户的虚拟空间通常大于实际的内存空间部分交换:与交换技术相比较,虚拟内存技术调入和调出是对部分虚拟地址空间进行的不连续性:物理内存分配的不连续 虚拟页...
一、软件工程概论 概念 软件危机(软件开发和维护过程中遇到的一系列严重的问题)软件开发成本日益增长软件开发进度难以控制软件质量难以保证软件维护困难 成本,质量难以保证,维护难...
一、导论 概念 操作系统极小化定义:内核才是操作系统中断:当出现需要时,CPU暂时停止当前进程的执行,转而执行处理新情况的中断处理程序。当执行完该中断处理程序后,则重新从刚才...
文件系统在存储设备上组织文件的方法和数据结构操作系统中负责管理和存储文件信息的模块系统角度对存储设备的空间进行组织和分配负责文件检索、读写等操作目标:存取速度和存储空间效率用...
磁盘结构和管理 磁道:磁头在盘片表面划出的圆形。外缘“0”开始编号 扇区:磁道被分为若干弧段,称为扇区。扇区大小:512字节 柱面:具有相同编号的磁道形成的圆柱,有几个磁道就...
I/O基本概念 I/O系统的主要对象:I/O设备和对应的设备控制器 I/O系统的主要任务完成用户提出的I/O请求提高I/O速率改善I/O设备的利用率 I/O系统的基本功能隐藏...
什么是学习型索引(Learned Index)? The Case for Learned Index Structures 来自 Tim Kraska 团队,一维数据学习 ...
名称:A Tutorial on Learned Multi-dimensional Indexes会议:SIGSPATIAL(2020)机构:Purdue Universi...
1. 下载 SQL Server 2019 Express 版 我会更推荐在虚拟机中安装,而不是在本机环境。因为 SQL Server 后期卸载的时候很可能卸载不干净,容易产...
code & docs 点这里[https://pgm.di.unipi.it/] 摘要 我们提出了第一个这样的学习型索引:它在最坏的情况下在可证明有效的时间和空间范围内支持...
Layout 就是数据分区那个,每个分区有一个 id,大概就是 layout,我们的 layout 其实就是为了迎合 RMI 这个接口,适配上去。 查询的话基本分成三个步骤:...
数据库 和 数仓 的本质区别? 数据库 Database (Oracle, Mysql, PostgreSQL)主要用于事务处理,数据仓库 Datawarehouse (Am...
Dabble Kraska 等人提出使用机器学习模型代替传统的 B 树索引,并在真实数据集上取得了不错的效果,但其提出的模型假设工作负载是静态的、只读的,对于索引更新问题没有...
[1] Kraska, Tim, Alex Beutel, Ed H. Chi, Jeffrey Dean, and Neoklis Polyzotis. "The case...