sas硬盘与ssd硬盘的区别,sas sata ssd区别
背景
以下是对3种数据科学工具的简要描述:
SAS:毫无疑问,SAS一直是商业分析领域的市场领导者。该软件提供了大量的统计功能,具有良好的图形用户界面(Enterprise GuideMiner),方便人们快速学习,提供了优秀的技术支持。然而最后却成为了最贵的选择,并且不具备丰富的最新统计功能。
R:R是SAS的开源版本,传统上用于学术和研究目的。因为它的开源特性,最新的统计功能即将发布,网上也有很多学习文档。r是一个性价比非常高的选择。
Python:Python是一种开源语言,使用量与日俱增。如今,它的扩展库(numpy、scipy和matplotlib)和函数可以用于几乎任何你可能想做的统计操作/模型构建。自从panda推出以来,它在结构化数据操作方面变得非常强大。
属性比较(比较角度)
我将从以下8个方面对这些语言进行比较:
可用性/成本
伊雪
数据处理能力
图形功能
工具的进步
工作情况
深度学习支持
客户服务支持和社区
我是从分析师的角度来比较这些的,所以,如果你想给公司买一个工具,你可能在这里得不到完整的答案,但是下面的信息还是有用的。对于这三个工具,我对每个比较属性进行评级(1低;5高)。
这些比较属性的权重取决于你的职业和抱负。
1.可用性/成本
SAS是一种商业软件,价格昂贵,对于大多数专业人士(作为个人)来说仍然遥不可及。然而,它在私营部门的市场份额最高。因此,除非您的组织已经购买了sa,否则可能很难获得它。虽然SAS提供了可以使用Jupyter笔记本的免费大学版,但是还是有一定的局限性!
而RPython是完全免费的。以下是我对这个参数的评价:
SAS3
r5
python5
2.简单易学
SAS易于学习,并为那些已经了解SQL (PROC
-SQL).即使没有,它的知识库中也有一个良好稳定的图形用户界面。资源方面,各个大学的网站上都有教程,SAS有全面的文档。有SAS培训机构的认证,但是要花钱才能拿到。
在这里列出的三个工具中,R的学习曲线最陡,因为你需要学习和理解编码。r是一种低级编程语言,所以一个简单的过程可能需要很长的代码。
结构化查询语言
https://www.analyticsvidhya.com/blog/2015/03/basics-sql-rdbms/
过程sql
https://www . analyticsvidhya . com/blog/2015/04/data-exploration-SAS-data-step-proc-SQL/
Python在编程领域以简单著称,对于数据分析也是如此。虽然目前为止还没有广泛使用的图形界面,但是希望Python笔记本越来越主流,为文档和分享提供很大的功能。
SAS4.5
r2.5
python3.5
3.数据处理能力
在过去,这一直是SAS的优势。r在内存(RAM)中执行所有计算,因此计算受到32位机器上RAM数量的限制,但现在不再是这样了。这三个工具都有很好的数据处理能力和并行计算选项,我认为这已经不是很大的区别了。都可以集成Hadoop和Spark,也支持Cloudera和ApachePig。
SAS4
r4
python4
4.图形功能
SAS有很好的功能图形功能,但是,它只是功能性的。任何绘图的定制都很难,需要了解复杂的SAS图形(程序扩展)包。
r和Python有非常高级的图形功能,还有很多软件(程序扩展)包会给你提供高级的图形功能。
现在,随着Python中plotly和Seaborn的引入,自定义绘图变得前所未有的简单。
SAS3
r4.5
python4.5
5.工具进度
这三个工具都有最基本和最需要的功能,只有在研究最新的技术和算法时,这个功能才是重要的。
由于其开放性,RPython可以快速获得最新的功能,而SAS在新版本的推出中更新了功能。因为R在学术界应用广泛,新的函数发展很快。
尽管如此,SAS在一个受控的环境中发布更新,因此它们已经过良好的测试。另一方面,RPython是开放的,在最新功能的开发中有可能出错。
SAS4
r4.5
python4.5
6.工作情况
在全球范围内,SAS仍然是市场的领导者,大多数大型组织仍然在使用SAS。另一方面,R/Python是初创企业和性价比高的公司更好的选择。此外,据报道,R/Python相关的工作在过去几年中有所增加。这是网上广泛公布的一个趋势,显示了R和SAS工作的趋势。用于数据分析的Python工作具有与R工作相似或更高的趋势:
下图中,蓝色代表R,橙色代表SAS。
下图中,蓝色代表R,橙色代表Python。
数据科学工作中使用的工具分布如下:
SAS4
r4.5
python4.5
7.客户服务支持和社区
r和Python有最大的线上社区,但是没有客服支持。所以,如果你有麻烦,那就靠你自己了。但是,你会得到很多帮助。
SAS提供专门的客户服务社区。因此,如果您对安装有任何问题或任何其他技术挑战,您可以联系他们。
SAS4
r3.5
python3.5
8.深度学习支持
SAS的深度学习还处于起步阶段,还有很多工作要做。
Python在这个领域取得了很大的进步。它有很多(程序扩展)包,比如tensorflow和keras。
r最近增加了对这些包和一些基本包的支持。R中的KerasR和keras包充当Python包keras的接口。
SAS2
python4.5
r3
其他因素:
以下是一些值得注意的要点:
Python在Web开发中应用广泛。如果从事线上业务,可以同时使用Python进行Web开发和分析。
SAS过去在部署端到端基础设施(可视化分析、数据仓库、数据质量、报告和分析)方面有很大优势,但现在可以在SAP HANA和Tableau等平台上集成/支持R。这个优势已经不明显了。虽然离SAS那样的无缝集成还有很长的路要走,但是这个旅程已经开始了。
结论
在今天的情况下,我们看到市场稍微向Python倾斜。考虑到该行业的动态,打赌什么会占上风还为时过早。根据你的情况(职业阶段,财务状况等。),可以增加自己的权重,想出可能适合自己的方案。以下是一些具体的场景:
如果你是分析行业的新人(尤其是在印度),我建议你把SAS作为第一语言学习。简单易学,就业市场占有率最高。
如果你是一个在这个行业已经有一段时间的人,你应该尝试学习一种新的工具来分散你的专业知识。
对于行业内的专家和专业人士,人们至少应该知道其中的两个,这将增加很多灵活性,并为未来开辟新的机会。
如果你是初创/自由职业者,R/Python更有用。
从策略上讲,有更多实际帮助和培训的企业可以选择SAS作为一个选项。
研究人员和统计学家选择R作为替代,因为它有助于进行大量的计算。就像他们说的,R是为了完成工作,而不是让你的电脑更简单。
由于其轻量级的特性和不断增长的社区,Python显然成为了当今初创企业的选择,这也是深度学习的最佳选择。
这是最终的记分卡: