应用简介
JetBrains DataSpell是一款功能强大的数据科学IDE,可以帮助用户轻松处理各种数据,解决各种数据方面的IDE需求,提升生产效率。软件提供了智能代码完成、即时错误检查和快速修复、轻松导航等功能,有效的提高了大家的工作效率,让编程更加轻松。
【软件功能】
1、针对数据科学应用开发,推出了最新称为的IDE,提供专业数据科学人员,一个可供探索性数据分析,以及建立机器学习模型雏形的高效环境。
2、随着Python成为数据科学通用语言,原本想要在现有Python开发环境PyCharm,支持更多的数据科学功能,但是经过一年的开发以及收到的用户回馈,他们发现,数据科学家和软件开发人员想的不一样,对工具的工作流程有不同要求与期待,因此决定使用PyCharm的IDE引擎作为基础,另外开发一个新的IDE。
目前仍在积极开发中,部分功能尚未完成,远端笔记本支持还是实验功能,默认配置不会启用该功能,用户必须手动启用,而对JavaScript输出支持也还不理想,之後版本将会有所改善。想试用的数据科学家,可以填写申请表,官方将会逐步向申请者开放。
3、JetBrains DataSpell提供了Jupyter笔记本的原生支持,官方提到,在新IDE中提供的Jupyter笔记本,将会是网页Jupyter的强化版本,输出仍会显示在单元格下,笔记本外观也会与传统网页Jupyter笔记本相当,但新IDE的Jupyter笔记本可以在命令模式和编辑模式中简单切换,使得用户能够更容易地操作单元格和内容。
4、官方提到,强化功能还会包括Python程序开发辅助、开箱即用的内容表,以及可交互表格等。单元格输出支持Markdown和JavaScript语言,可使用诸如Plotly、Bokeh和IPyWidgets等函数库,而且IDE也同时支持本地端与远端的Jupyter、JupyterHub与JupyterLab服务器。
5、这个新的IDE暂时称呼,现在开放给想要嚐鲜的数据科学家试用。的一大重点,就是其专为数据处理设计的接口,数据相关的功能有较高的优先度,这样的想法反映在工具窗口、主要选单、操作等布局上,把程序码库仅视为一个工作空间而非一个专案,在这个工作空间中,用户可以在任务间切换并且使用新的笔记本,就像是重新使用已配置的环境一样。在数据处理上可以更加实际且高效。
6、另外,也能良好地支持Python脚本,并包含许多可用来处理数据和视觉化的工具。虽然短期目标主要还是支持Python,但是也会添加对R以及其他数据科学语言的支持,目前对R已经有了基础的支持,只是功能仍受到限制。
【软件特色】
1、单元格输出支持 Markdown 和 JavaScript。与运行在本地设备上的 Jupyter Notebook 以及远程 Jupyter、JupyterHub 和 JupyterLab 服务器兼容。
2、此外,支持 Python 脚本,提供了一个运行代码的 REPL,以及用于处理数据和数据可视化的额外工具,包括可交互式的和静态的。还支持包括 Plotly、Bokeh、ipywidgets 和 Altair 在内的 Python 科学类库。目前这个尚处于早期预览阶段的除了支持 Python 以外,还提供了对 R 语言的基本支持,将来还会增加对 Julia 等其他数据科学语言的支持。
3、项目经理 Andrey Cheptsov 表示,目标是在企业 IT 组织发起更多 AI 项目以在数字业务转型背景下降低成本或增加收入的时候提高数据科学家的整体生产力。
4、谈到 Python 生态,从来没有专门为数据科学设计的 IDE。参与数据科学的人员必须使用编辑器、开发者 IDE 或独立的 Jupyter Notebook。只有在 R 语言的生态中才真正提供了用于数据科学的独立 IDE。我们经常听到有 RStudio 经验的人抱怨 Python 不存在类似的东西。JetBrains DataSpell 就是这样一款面向数据科学家的 IDE。
5、当然,在引入任何需要工具时,使用习惯是最大的挑战,因为每个数据科学团队都有一套自己常用的工具和定义的工作流程。DateSpell 如何能够快速融入数据科学家团队的工作流程,以提高生产力也将是面临的一大挑战。
【软件亮点】
一、智能 Jupyter 笔记本
1、针对高交互性进行了调整
只需一次按键即可在命令和编辑器模式之间切换。使用箭头键在单元格上导航。使用所有标准的 Jupyter 快捷方式。享受完全交互式的输出——就在单元格下。
2、智能编码辅助
在编辑代码单元格时,享受智能代码完成、即时错误检查和快速修复、轻松导航等等。
3、本地和远程笔记本
使用本地 Jupyter 笔记本或直接从 IDE 轻松连接到远程 Jupyter、JupyterHub 或 JupyterLab 服务器。
二、交互式 Python 脚本
1、科学 Python 控制台
在 Python 控制台中以交互方式运行 Python 脚本或任意表达式。实时查看变量的输出和状态。
2、Python 脚本中的单元格
使用 #%% 分隔符将 Python 脚本拆分为代码单元格,并像在 Jupyter 笔记本中一样单独运行它们。
3、数据和可视化输出
通过交互式控件就地浏览数据帧和可视化。支持所有流行的 Python 科学库,包括 Plotly、Bokeh、Altair、ipywidgets 等。
三、内置工具和集成
1、版本控制
克隆 Git 项目、提交和推送更改、处理多个分支、管理更改列表以及在提交之前暂存更新。
2、终端
通过内置终端使用命令行 shell,该终端支持与您的操作系统相同的所有命令。
3、数据库工具
直接从 IDE 访问和查询数据库。在编辑 SQL 代码、运行查询、浏览数据和更改架构时依靠智能编码帮助。