Glue
AWS Glue 是一项无服务器数据集成服务,可让使用分析功能的用户轻松发现、准备、移动和集成来自多个来源的数据。您可以将其用于分析、机器学习和应用程序开发。它还包括用于编写、运行任务和实施业务工作流程的额外生产力和数据操作工具。
通过使用 AWS Glue,您可以发现并连接到 70 多个不同的数据来源,并在集中式数据目录中管理您的数据。您可以直观地创建、运行和监控“提取、转换、加载(ETL)”管道,以将数据加载到数据湖中。此外,您可以使用 Amazon Athena、Amazon EMR 和 Amazon Redshift Spectrum 立即搜索和查询已编目数据。
AWS Glue 将主要数据集成功能整合到一项服务中。其中包括数据发现、现代 ETL、清理、转换和集中式编目。这也是一项无服务器服务,即无需管理基础设施。通过在一项服务中灵活支持 ETL、ELT 和流式传输之类的所有工作负载,AWS Glue 可为不同工作负载和类型的用户提供支持。
此外,AWS Glue 可以轻松地在您的架构中集成数据。它可与 AWS 分析服务和 Amazon S3 数据湖集成。AWS Glue 具有集成式界面和任务编写工具,对于从开发人员到业务用户在内的所有用户来说,使用十分方便,还可针对不同的技术技能组合提供定制解决方案。
AWS Glue 可按需扩展,因此可帮助您专注于能最大限度地提高数据价值的高价值活动。可针对任何数据大小进行扩展,并支持所有数据类型和架构变化。为了提高灵活性并优化成本,AWS Glue 提供内置的高可用性和即付即用计费模式。
Components
- Data catalog
- Database
- Table
- Crawler and Classifier
- Job
- Trigger
- Development endpoint
Reference
Linked Mentions
-
No backlinks found.