摘要: 本文记录历史经典论文,附本站链接
【对数据分析、人工智能、金融科技、风控服务感兴趣的同学,欢迎关注我哈,阅读更多原创文章】
我的网站:潮汐朝夕的生活实验室
我的公众号:潮汐朝夕
我的知乎:潮汐朝夕
我的github:FennelDumplings
我的leetcode:FennelDumplings
数学
名称 | 作者 | 年份 | 备注 | 相关文章 |
---|---|---|---|---|
《通信的数学理论》 | 香农 | 1948 | 开创信息论 | - |
《The Theory of Dynamic Programming》 | Bellman | 1954 | 奠定动态规划的理论基础 | - |
[《On the Hypotheses which lie at the Base of Geometry》] | 黎曼 | 1854 | 开创黎曼几何 | - |
[《NON-COOPERATIVE GAMES 》] | 纳什 | 1950 | 奠定非合作博弈理论基础 | - |
经济金融
名称 | 作者 | 年份 | 备注 | 相关文章 |
---|---|---|---|---|
《Statistical-mechanics-of-money-wealth-and-income》 | V.M. Yakovenko | 2009 | 参考统计力学,提出指数型分布在货币、财富和收入中的普遍性 | - |
大数据系统
名称 | 作者 | 年份 | 备注 | 相关文章 |
---|---|---|---|---|
《MapReduce: Simplified Data Processing on Large Clusters》;中文版 | 2004 | 提出MapReduce | - | |
《Bigtable: A Distributed Storage System for Structured Data》;中文版 | 2006 | 分布式结构化数据存储系统 | - | |
《The Google File System》;中文版 | 2003 | 分布式文件系统设计 | - | |
《F1: A Distributed SQL Database That Scales》 | 2013 | TPAP数据库 | - |
数据结构
名称 | 作者 | 年份 | 备注 | 相关文章 |
---|---|---|---|---|
《skip lists: a probabilistic alternative to balanced trees》 | william pugh | 1990 | 提出跳表 | 跳表 |
《A Fast Algorithm for Finding Dominators in a Flowgraph》 | Tarjan | 1979 | 提出在有向图中寻找支配者的算法 | 有向图的必经点,支配树 |
算法
名称 | 作者 | 年份 | 备注 | 相关文章 |
---|---|---|---|---|
《Fast Pattern Matching in Strings》 | Kruth, Morris, Pratt | 1977 | 提出字符串精确匹配的 KMP 算法 | KMP算法与代码模板 |
《A Fast String Searching Algorithm》 | Boyer, Moore | 1977 | 提出字符串精确匹配的 BM 算法 | 字符串精确匹配的BM算法 |
《A Very Fast Subtring Search Algorithm》 | Sunday | 1990 | 提出 BM 算法的变种 Sunday 算法 | 字符串精确匹配BM算法的变种:Sunday算法 |
《Practical Fast Searching in String》 | Horspool | 1990 | 提出 BM 算法的变种 Horspool 算法 | 字符串精确匹配BM算法的变种-Horspool算法 |
《Suffix arrays: A new method for on-line string searches》 | Manber, Myers | 1989 | 提出后缀数组 | |
《File Searching Using Variable Length Keys 》 | Briandais | 1959 | 首次提出 Trie 的概念 | |
《A New Linear-Time “On-Line” Algorithm for Finding the Smallest Initial Palindrome of a String》 | Manacher | 1975 | 提出回文子串的 Manacher 算法 | |
《Efficient randomized pattern-matching algorithms》 | Karp, Rabin | 1987 | 提出RK算法(字符串哈希) | |
《Efficient String Matching An Aid to Bibliographic Search》 | Aho,Corasick | 1975 | 提出多模式匹配的 AC 自动机 |
计算机系统
名称 | 作者 | 年份 | 备注 | 相关文章 |
---|---|---|---|---|
[《A symbolic analysis of relay and switching circuits》] | 香农 | 1938 | 奠定数字电路理论基础 | - |
[《On the Criteria To Be Used in Decomposing Systems into Modules》] | Parnas | 1972 | 提出模块化设计的概念,对软件工程有深远影响 | |
《A Protocol For Packet Network Intercommunication》 | Kahn | 1974 | 奠定TCP/IP协议的基础 | - |
[《New Directions in Cryptography》] | Diffie | 1976 | 提出公钥密码系统 | |
[《A Method for Obtaining Digital Signatures and Public-Key Cryptosystems》] | Rivest | 1978 | 提出数字签名系统和RSA算法 | |
[《A Public-Key Cryptosystem and a Signature Scheme Based on Discrete Logarithms》] | Elgamal | 1985 | 提出基于离散对数的公钥加密和签名方案 | |
[《The Elliptic Curve Digital Signature Algorithm (ECDSA)》] | Johnson | 1999 | 提出基于椭圆曲线的公钥加密 | |
[《Error detecting and error correcting codes》] | Hamming | 1950 | 提出汉明码,是一种信道纠错编码 | |
[《A Method for the Construction of Minimum-Redundancy Codes》] | Huffman | 1952 | 提出哈夫曼编码,是一种无损压缩编码 | |
[《Arithmetic Coding for Data Compression》] | Witten | 1984 | 提出算术编码,是一种无损压缩编码 | |
[《Universal Algorithm for Sequential Data Compression》] 、[《Compression of Individual Sequences via Variable-Rate Coding》] | Jacob Ziv | 1977、1978 | 提出LZ77、LZ78,这是基于字典的压缩算法,用于gzip,png等 | |
[《A Relational Model of Data for Large Shared Data Banks》] | Codd | 1970 | 提出关系型数据库模型 | |
[《The entity-relationship model toward a unified view of data》] | Chen | 提出实体-关系模型 |
数据挖掘
名称 | 作者 | 年份 | 备注 | 相关文章 |
---|---|---|---|---|
[《A statistical interpretation of term specificity and its application in retrieval》] | Karen Jones | 1972 | 提出TF-IDF | |
[《The PageRank Citation Ranking: Bringing Order to the Web》] | Lawrence Page | 1999 | 提出了PageRank算法 | |
[《The Anatomy of a Large-Scale Hypertextual Web Search Engine》] | Lawrence Page | 1998 | 描述了Google搜索引擎的架构和算法 | |
[《C4.5_Programs for Machine Learning》] | Quinlan | 1993 | 提出 C4.5 | |
[《The link prediction problem for social networks》] | Kleinberg | 2003 | 提出社交网络中的链接预测问题 | |
[《The Perceptron: A Probabilistic Model for Information Storage and Organization in the Brain》] | Rosenblatt | 1958 | 提出感知机,开创人工神经网络 | |
[《Some Methods for classification and Analysis of Multivariate Observations》] | MacQueen | 1967 | 提出k-means的早期版本,对聚类算法产生深远影响 | |
[《Least squares quantization in PCM》] | Lloyd | 1982 | 提出k-means的理论基础和实现步骤,对应用起到关键作用 | |
[《Support-Vector Networks》] | Vapnik | 1995 | 提出SVM的理论基础和算法实现 | |
[《Maximum Likelihood from Incomplete Data via the EM Algorithm》] | Dempster | 1977 | 提出EM算法基本原理 | |
[《Fast Algorithms for Mining Association Rules 》] | Agrawal | 1994 | 提出Apriori关联规则算法 | |
[《A Decision-Theoretic Generalization of On-Line Learning and an Application to Boosting》] | Freund | 1995 | 提出AdaBoost算法 | |
[《Nearest Neighbor Pattern Classification》] | Cover | 1967 | 提出最近邻算法,奠定kNN的理论基础 | |
[《Discriminant Adaptive Nearest Neighbor Classification and Regression 》] | Hastie | 1996 | 提出kNN算法 | |
[《Classification and Regression Tree》] | Breiman | 1984 | 提出CART分类与回归树 | |
《Idiot’s Bayes: Not So Stupid After All?》 | Hand | 2001 | 朴素贝叶斯算法 | |
[《Mining frequent patterns without candidate generation》] | Jiawei Han | 2004 | 提出 FP-Tree 和 FP-growth 挖掘方法 | |
《BIRCH: an efficient data clustering method for very large databases》 | ZTian | 1996 | 提出大规模数据集高效聚类的 BIRCH 算法 | |
《Mining Sequential Patterns: Generalizations and Performance Improvements》 | Agrawal | 1995 | 提出序列模式挖掘的 GSP 算法 |
AI
名称 | 作者 | 年份 | 备注 | 相关文章 |
---|---|---|---|---|
[《ImageNet Classification with Deep Convolutional Neural Networks》] | Alex Krizhevsky | 2012 | 提出深度卷积神经网络 | |
[《You Only Look Once: Unified, Real-Time Object Detection》] | Joseph Redmon | 2016 | 提出YOLO实时物体检测 |