[TOC]
大数据平台架构演进
经典数仓架构
在类似于Hadoop系列的大数据分析系统大行其道之前,数据分析工作已经经历了长足的发展,尤其是以BI系统为主的数据分析,已经有了非常成熟和稳定的技术方案和生态系统,对于BI系统来说,大概的架构图如下:
my blog
[TOC]
在类似于Hadoop系列的大数据分析系统大行其道之前,数据分析工作已经经历了长足的发展,尤其是以BI系统为主的数据分析,已经有了非常成熟和稳定的技术方案和生态系统,对于BI系统来说,大概的架构图如下:
|
|
[TOC]
Vimium 这个名字其实是 Vim 和 Chromium 的合体。很多人可能不知道 Vim,这么说吧,你是不是经常在电影里看到那些顶尖的黑客,他们在屏幕上来去自如,最关键的是,他们竟然都不用鼠标?没错,狭义地说,Vim 其实是 Linux 等平台上的一款文本编辑器,它可以让你彻底脱离鼠标,通过一系列快捷键,来操作任何一件事情。
实时消息传输协议(RTMP)最初是由 Macromedia 为互联网上 Flash player 和服务器之间传输音频、视频以及数据流而开发的一个私有协议。RTMP协议是一个互联网TCP/IP五层体系结构中应用层的协议。RTMP协议中基本的数据单元称为消息(Message)。当RTMP协议在互联网中传输数据的时候,消息会被拆分成更小的单元,称为消息块(Chunk)。(本文内容多来自文档翻译)
FM算法,全称Factorization Machines,一般翻译为“因子分解机”。2010年,它由当时还在日本大阪大学的Steffen Rendle提出。此算法的主要作用是可以把所有特征进行高阶组合,减少人工参与特征组合的工作,工程师可以将精力集中在模型参数调优。FM只需要线性时间复杂度,可以应用于大规模机器学习。经过部分数据集试验,此算法在稀疏数据集合上的效果要明显好于SVM。
CentOS 6.X 自带的Python版本是 2.6 , 目前python主流的编译环境是2.7,故整理一下python2.6到2.7的升级过程。
Redis Cluster是3.0版本之后提供的新功能,采用了P2P的去中心化架构,而没有采用像Codis之类的Proxy解决方案中的中心协调节点设计。