大数据算法-目录

  |  

摘要: 大数据算法的内容

【对数据分析、人工智能、金融科技、风控服务感兴趣的同学,欢迎关注我哈,阅读更多原创文章】
我的网站:潮汐朝夕的生活实验室
我的公众号:潮汐朝夕
我的知乎:潮汐朝夕
我的github:FennelDumplings
我的leetcode:FennelDumplings


推荐一份大数据算法的参考资料:

绪论

  • 大数据概述
    • 什么是大数据
    • 无处不在的大数据
    • 大数据的特点
    • 大数据的应用
  • 大数据算法
    • 大数据上求解问题的过程
    • 大数据算法的定义
    • 大数据的特点与大数据算法
    • 大数据算法的难度
    • 大数据算法的应用
  • 大数据算法设计与分析
    • 大数据算法设计技术
    • 大数据算法分析技术

时间亚线性算法

  • 时间亚线性算法概述
    • 平面图直径问题的亚线性算法
    • 排序链表搜索的亚线性算法
    • 两个多边形交集问题的多项式时间算法
  • 最小生成树代价估计
    • 连通分量个数估计算法
    • 最小生成树代价估计算法
  • 时间亚线性判定算法概述
  • 数组有序的判定算法
  • 串相等判定算法

空间亚线性算法

  • 空间亚线性算法概述
  • 水库抽样
  • 寻找频繁元素的非随机算法
    • 频繁元素的精确解
    • 频繁元素的Misra-Gries算法
  • 估算不同元素的数量
    • 基本算法
    • 改进算法
  • 寻找频繁元素的随机算法
    • 略图法
    • 计数最小略图
  • 估计频率矩
    • 频率矩的AMS估计算法
    • 基于拔河略图的频率矩估计
    • 使用稳定分布估计范数

外存算法

  • 外存存储结构与外存算法概述
  • 外存算法示例:外存排序算法
    • 外存归并排序算法
    • 外存多路快速排序算法
    • 外存计算的下界
  • 外存数据结构示例:外存搜索树

外存查找结构

  • B树
  • 加权平衡B树
  • 持久B树
  • 缓存树
  • KDB树
  • O树

外存图数据算法

  • 线性表排名及其应用
    • 线性表排名问题
    • 欧拉回路
    • 父子关系判定
    • 前序计数
    • 计算子树大小
  • 时间前向处理方法
    • DAG形式逻辑表达式计算问题
    • 最大独立集合算法
  • 缩图法
    • 基于缩图法的图连通分量计算半外存算法
    • 基于缩图法的图连通分量计算全外存算法
    • 最小生成树算法
  • 广度优先搜索和深度优先搜索
    • 有向图的BFS和DFS
    • 无向图的BFS
    • 无向图更高效的BFS算法
  • 单源最短路径
    • 竞赛树
    • Dijkstra算法的I/O高效版本

MapReduce算法概述

  • MapReduce基础
    • MapReduce的基本模型
    • mapper和reducer
    • partitioner与combiner
  • MapReduce算法设计方法
    • 局部聚合
    • 两种重要的算法设计模式——词对法和条块法
    • 二次排序
    • MapReduce算法设计与算法实现技巧

MapReduce算法例析

  • 连接算法
    • 普通连接算法
    • 相似连接算法
  • 图算法
    • 基于广度优先搜索的MapReduce图处理算法
    • PageRank的MapReduce算法
    • 最小生成树的MapReduce算法
    • 使用图算法的注意事项

超越MapReduce的并行大数据处理

  • 基于迭代处理平台的并行算法
  • 基于图处理平台的并行算法
    • 并行结点计算
    • 并行结点计算的平台
    • 基于并行结点计算的单源最短路径算法的设计与实现
    • 计算子图同构

众包算法

  • 众包的定义
  • 众包的实例
  • 众包的要素和关键技术
    • 众包的流程
    • 众包的报酬
    • 众包中的关键技术
  • 众包算法例析

Share