This session will cover a series of use cases where you can store your data cheaply in files and analyze the data with Apache Spark, as well as use cases where you want to store your data into a different data source to access with Spark DataFrames. Here’s an example outline of some of the topics that will be covered in the talk: Use cases to store in file systems to use with Apache Spark: 1. Analyzing a large set of data files. 2. Doing ETL of a large amount of data. 3. Applying Machine Learning & Data Science to a large dataset. 4. Connecting BI/Visualization tools to Apache Spark to analyze large datasets internally. Use cases to store your data into databases for use with Apache Spark: 1. Random access, frequent inserts, and updates of rows of SQL tables. Databases have better performance for these use cases. 2. Supporting Incremental updates of Databases into Spark. It’s not performant to update your Spark SQL tables backed by files. Instead, you can use message queues and Spark Streaming or doing an incremental select to make sure your Spark SQL tables stay up to date with your production databases. 3. External Reporting with many concurrent requests. While Spark’s ability to cache your file data in memory will allow you to get back to fast interactive querying, that may not optimal for supporting many concurrent requests. It’s better to use Spark to ETL your data to summary tables or some other format into a traditional database to serve your reports if you have many concurrent users to support. 4. Searching content. A Spark job can certainly be written to filter or search for any content in files that you’d like. ElasticSearch is a specialized engine designed to return search results quicker.

Hora

19:00 - 20:00 hs GMT+1

Organizador

Databricks
Compartir
Enviar a un amigo
Mi email *
Email destinatario *
Comentario *
Repite estos números *
Control de seguridad
Enero / 2026 221 webinars
Lunes
Martes
Miércoles
Jueves
Viernes
Sábado
Domingo
Lun 29 de Enero de 2026
Mar 30 de Enero de 2026
Mié 31 de Enero de 2026
Jue 01 de Enero de 2026
Vie 02 de Enero de 2026
Sáb 03 de Enero de 2026
Dom 04 de Enero de 2026
Lun 05 de Enero de 2026
Mar 06 de Enero de 2026
Mié 07 de Enero de 2026
Jue 08 de Enero de 2026
Vie 09 de Enero de 2026
Sáb 10 de Enero de 2026
Dom 11 de Enero de 2026
Lun 12 de Enero de 2026
Mar 13 de Enero de 2026
Mié 14 de Enero de 2026
Jue 15 de Enero de 2026
Vie 16 de Enero de 2026
Sáb 17 de Enero de 2026
Dom 18 de Enero de 2026
Lun 19 de Enero de 2026
Mar 20 de Enero de 2026
Mié 21 de Enero de 2026
Jue 22 de Enero de 2026
Vie 23 de Enero de 2026
Sáb 24 de Enero de 2026
Dom 25 de Enero de 2026
Lun 26 de Enero de 2026
Mar 27 de Enero de 2026
Mié 28 de Enero de 2026
Jue 29 de Enero de 2026
Vie 30 de Enero de 2026
Sáb 31 de Enero de 2026
Dom 01 de Enero de 2026

.

  • Comparativas de Software

    ¿No te salen las cuentas en la nube?

    La nube tiene importantes ventajas: ahorros de costes, facilidad para trabajar en equipos remotos, menor necesidad de administración de la infraestructura, mejoras de seguridad, etc. Sin embargo, al comentar con algunos clientes la posibilidad de migrar las licencias de Atlassian a cloud, me comentaron que habían hecho alguna experiencia de migración y no le salían tan bien las cuentas. Estos comentarios me hicieron reflexionar sobre cuáles podían ser las causas de que no salieran las cuentas y permitirme ofrecer algunas recomendaciones y consejos. ... Leer más

    Publicado el 22-Dic-2021 • 14.40hs

    0 comentarios

  • TODOS Comparativas de Software PDF

    Comparativas de software ERP para todos los sectores

    Publicado el 27-Set-2021 • 12.50hs

  • TODOS Comparativas de Software PDF

    Comparativas de software ERP para Fabricación

    Publicado el 27-Set-2021 • 09.51hs

.

.

.

.

.

Más Secciones »

Hola Invitado