在过去的一年中,我已经看到了很多旨在提高程序员分析能力的项目和工具。有时候,他们使得功能强大的仪表板或处理过程的脚本变得更加简单。而其他时候,他们只是以一个简单的消费方式来提供数据,而开发人员只做一点点工作。我认为这是一个有意义的趋势。
在这个移动应用和云资源非常常见的时代,开发一个简单的应用程序比以往任何时候都更容易。即使是在大公司,人们都可能为应用的普及或者加快商业化来争取资源。有时候,这甚至可能意味着将一些数据处理的权利注入到应用程序中去。
但无论是哪种情况,如果你的工作都是围绕着写代码,而不是数据流,你可能需要一点点帮助。这里有12个工具(按字母顺序排列),旨在帮助你们这样的人。
1、BitDeli
BitDeli是11月份推出来的,使程序员能够测量他们所使用Python脚本的几乎任何应用程序的指标。联合创始人兼首席执行官VilleTuulos告诉我,到那时候,脚本可以在必要的时候,甚至能以或是简单的或是复杂的方式,联合机器学习。与重量级的Hadoop相比,BitDeli认为它自己是分析方面轻量级的开发工程师。
2.Continuuity
Continuuity是雅虎前首席云建筑师ToddPapaioannou和Facebook的HBase的工程师JonathanGray的心血结晶,它希望帮助所有企业,像它创始人的前雇主一样经营公司。这个团队创造了一个大数据结构,降低了连接到Hadoop的HBase的集群的复杂性,还包括了一个完整的开发工具套件。他们的目标是无论是为内部或外部的客户,都可以很容易地编写大数据应用服务。
3.Flurry
Flurry就像是一个一站式的移动应用程序商店,它能够产生近1亿美元的年收入。它不仅帮助开发人员构建移动应用程序,还帮助他们分析这些应用程序的数据是怎样产生的,以便使他们变得更优秀。这些数据也支持该公司的广告网络,只要将广告放在目标用户那里,就可以通过这些应用程序赚钱。
4.
在谷歌开发者的工具箱中的所有工具中,谷歌PredictionAPI可能是最酷的。如果你有合适的数据来构建一个模型,那么PredictionAPI可以让机器来学习如何工作,从而可以识别任何图案类型并将答案反馈到到你的应用程序中。在谷歌给出的例子中,比如关于垃圾邮件检测、推荐引擎和情感分析的模型是怎样建立的,它提供了一步步的指示。
5.Infochimps
虽然Infochimps正努力使自己成为一家IT公司,但与该公司齐名的平台,也为开发者提供了真正有价值的东西。配置和管理大数据环境的顶尖技术是一个叫Wukong的东西,它是一个创造Hadoop作业以及使用Ruby脚本创造流数据流量的框架。Infochimps还保留了一个拥有API访问以及可供下载数据集的数据市场。
6.KeenIO
因为能够为移动开发商提供强大的分析功能,KeenIO在2012年Launchpad的竞争中以结构取胜了。只需插入一行代码就决定了什么被跟踪了,该公司称,他们的开发人员可以使用他们的应用程序,来跟踪几乎任何他们所希望跟踪的东西。在这一点上,它只是一个关于创建仪表板或查询程序的问题,以便把这些数据转化为有用的信息。
7.Kontagent
Kontagent的重点业务是其移动、社交和Web应用程序的分析平台,它们都是在Hadoop的基础设施之上建构的,能够处理真正的大数据。今年早些时候,该公司开发了一个新的产品,让用户使用SQL-likeHive的查询语言,为Hadoop挖掘其应用程序数据。他们还可以以他们想要的方式来挖掘,而不是跟踪定变量。
8.MortarData
MortarData是Hadoop的开发人员开发的,非常的简单明了。该公司提供的云服务,取代了MapReduce,并结合Pig和Python,已经有将近一年的时间了。在11月,它发布了Mortar框架的开放源码,这样是为了建立一个社区来共享数据集,并使编写Hadoop程序更容易。MortarData在亚马逊网络服务上运行,目前它把亚马逊S3和MongoDB(受亚马逊EC2的支持)作为数据源。
9.PlacedAnalytics
Placed摒弃了脚本、API和任何其他开发者所搜集的资料,只提供结果。涉及Placed的情况,这些结果就是是消费者实际使用移动应用程序和网站,还有业务名称的详细信息。这种类型的信息在吸引广告客户和通知应用程序设计方面是很有用的(例如,人们在驾驶的时候使用应用程序,可以实现语音控制功能)。
10.Precog
PRECOG可能看起来像其他任何专有的商业智能服务一样,但它其实有着不一样的地方。该公司提供的服务称为Labcoat,能够为开源Quirrel查询语言基础上的编写分析工作,提供一个交互式开发环境。IDE包括学习语言的教程以及一些复杂的功能,PRECOG的首席运营官杰夫?卡尔告诉我,即便是非技术人员,也可以在很短的时间内学会它。
11.SpringforApacheHadoop
Hadoop是用Java编写的,但是,这并不意味着Java开发人员能够很容易学习或使用它。原因是这样的,在2012年年初,SpringSource宣布Spring和ApacheHadoop的联合项目,它能够很容易的构建Java应用程序与Spring框架,从而为Hadoop工作。这意味着与其他Spring应用程序以及基于JVM语言的脚本的集成,同时这也是一个更简单的利用Hadoop,或者使用Hive和HBase等相关技术的方法,来开发应用程序。
12.StatsMix
和BitDeli和KeenIO一样,StatsMix希望开发人员使用他们已经知道的语言来收集和分析应用程序的数据。该服务可以自动跟踪某些指标,但使用StatsMixAPI和预定义的代码库的话,开发者可以添加自己想添加的指标。结果可通过仪表板的集合来发送,用户可以自定义、共享和使用,最终使得多个数据源集成到一个单一的视图上。