Cloudera Bantu Sederhanakan Data Lifecycle dengan Analytic Experiences

Data Lifecycle Illustration

Pengelolaan dan pengamanan kumpulan data secara efektif, enrichment, analisis, eksperimentasi dan visualisasi analitik, sangat penting untuk mengarungi badai data. Hasilnya adalah para ‘pahlawan data’ bisa berkolaborasi dengan lebih baik dan lebih cepat dalam menyajikan use case berbasis data (data-driven use cases), seperti maintenance dan pemahaman komprehensif mengenai pelanggan yang bersifat prediktif.

Hal ini yang dibutuhkan oleh bisnis untuk bersaing dan melayani customer dengan lebih baik lagi. Untuk itu, Cloudera mengumumkan kehadiran layanan data cloud terbaru dan yang akan datang pada Cloudera Data Platform (CDP), yaitu: CDP Data Engineering; CDP Operational Database; dan CDP Data Visualization.

Layanan-layanan terbaru ini adalah pengalaman analitik (analytic experiences) yang khusus dirancang bagi spesialis data. Berbeda dengan layanan seperti ini pada umumnya yang membutuhkan add-ons untuk kemampuan-kemampuan penting seperti otomatisasi workflow, prioritas pekerjaan, dan penyetelan kinerja, layanan data cloud dari Cloudera sudah memasukkan seluruh kemampuan tersebut untuk membantu para data engineer, analis data, dan data scientist untuk bekerja lebih cerdas dan lebih cepat.

Layanan data cloud kelas enterprise CDP memang dirancang khusus untuk memungkinkan para spesialis data agar semakin percaya diri dalam mengarungi tantangan dalam mengelola data yang tumbuh secara eksponensial dan menjalankan analisis terhadap data yang tersebar di berbagai public dan private cloud.

Setiap bisnis sedang menghadapi arus badai perubahan yang radikal, dipicu oleh dampak pandemi global. Segala sesuatu, mulai dari rapat tatap muka, berbelanja di toko grosir, telah berpindah ke jagad digital dengan sangat cepat. Hasilnya, organisasi atau perusahaan menghasilkan lebih banyak data daripada sebelumnya di setiap titik dalam bisnis mereka.

Ada lebih banyak transaksi digital yang harus dilacak dan dipantau. Setiap interaksi antara para pekerja, pelanggan, dan mitra berlangsung secara virtual. Dengan begitu banyak data yang membanjiri setiap perusahaan, Cloudera justru yakin bahwa kondisi ini memberikan peluang untuk membuat keputusan bisnis yang lebih baik dan lebih cepat.

Cloudera Data Platform dapat memanfaatkan jumlah dan jenis data yang hampir tidak terbatas, dari titik mana pun dalam life cycle data, untuk mendukung pengambilan keputusan yang lebih baik.

Dengan integrasi data lifecycle data engineer, data analysts, dan data scientist dapat bekerja pada data yang sama secara aman dan efisien, tidak peduli di mana data tersebut berada atau di mana proses analitiknya dilakukan.

CDP tidak semata-mata membantu meningkatkan produktivitas spesialis data tapi juga membantu tim data bekerja sama dengan lebih baik lagi, berkat arsitektur data hybrid yang unik. Arsitektur ini mengintegrasikan pengalaman analitik di seluruh data lifecycle di seluruh public dan private cloud.

Customer kami memahami pentingnya data lifecycle untuk pengambilan keputusan berdasarkan data di seluruh lini bisnis mereka, yang secara tradisional akan mengintegrasikan kluster data untuk NiFi, Kafka, Spark, Impala, Hive, HBase, dan sebagainya,” kata Arun Murthy, Chief Product Officer, Cloudera.

“Hal-hal seperti ini masih dilakukan oleh para pakar data – baik arsitek dan developer – yang dapat menggunakan layanan klaster data lifecycle kami, yakni CDP Data Hub. Kini dengan pengalaman analitik pada CDP, pakar data seperti teknisi, analis, dan data scientist akan mendapatkan apa yang mereka butuhkan untuk bekerja lebih baik, tanpa harus memahami atau mengelola kluster, dengan keamanan dan tata kelola terintegrasi di seluruh data lifecycle untuk memudahkan TI. Ini adalah data cloud kelas enterprise yang cocok bagi semua kalangan,” jelasnya.

 

CDP Data Engineering

CDP Data Engineering adalah layanan Apache Spark yang paling powerful di Kubernetes dan mencakup berbagai kemampuan untuk produktivitas lebih tinggi, yang biasanya tidak akan disediakan oleh layanan data engineering tingkat dasar:

  • Monitoring, troubleshooting, dan performance tuning berbasis Visual GUI untuk menghasilkan debugging dan penyelesaian masalah secara lebih cepat
  • Native Apache Airflow dan API yang mantap untuk melakukan orkestrasi dan otomatisasi penjadwalan job dan pengiriman berbagai data pipeline yang kompleks ke mana saja
  • Isolasi sumber daya dan job management berbasis GUI yang terpusat
  • Integrasi data lifecycle CDP dan keamanan serta tata Kelola SDX

“Peran data engineering dalam mempersiapkan data science sangat penting untuk operasional,” kata Stewart Bond, Research Director of IDC’s Data Integration and Intelligence Software service.

Stewart menambahkan, “Ada masalah umum pada model machine learning (ML) yang tidak masuk ke tahap produksi, sebagian karena tantangan yang terkait dengan otomatisasi pipeline data engineering ketika organisasi atau perusahaan mengalami kesulitan dalam mencari hubungan antara data-data yang diperoleh. Ada nilai tersendiri dalam platform terintegrasi yang dapat menyatukan semuanya.”

Mempersiapkan data untuk analisis dan kasus penggunaan dalam produksi di seluruh data lifecycle sangat penting dalam mentransformasi data menjadi nila bisnis. CDP Data Engineering adalah layanan data engineering yang dibuat khusus untuk mempercepat enterprise data pipelines mulai dari pengumpulan dan enrichment, hingga menghasilkan insight, dalam skala besar.

 

CDP Operational Database

Karena kegiatan bisnis terus menghasilkan data terstruktur dan tidak terstruktur dalam volume yang besar, maka para developers ditugaskan untuk membangun aplikasi yang memberikan akses data kepada banyak pihak (demokratisasi akses terhadap data), memungkinkan tindakan secara real-time, dan menjadi bagian yang integral dari operasi bisnis dan upaya untuk meraih pendapatan.

Tidak seperti layanan database umum, CDP Operational Database adalah layanan database NoSQL berkinerja tinggi yang menyediakan skala dan kinerja yang tak tertandingi untuk aplikasi operasional bisnis yang sangat penting, dengan beberapa penawaran sebagai berikut:

  • Mendukung skema yang evolusioner untuk memanfaatkan kekuatan data dengan tetap mempertahankan fleksibilitas dalam desain aplikasi dengan memungkinkan perubahan pada model data yang mendasarinya, tanpa harus melakukan perubahan pada aplikasi
  • Auto-scaling berdasarkan utilisasi workload pada kluster untuk mengoptimalkan utilisasi dan biaya infrastruktur
  • Client access yang multi-modal dengan value kunci NoSQL menggunakan HBase APIs dan SQL relasional dengan JDBC, membuat CDP Operational Database bisa diakses oleh para perancang yang ingin membangun aplikasi menggunakan MySQL, Postgres, dan sebagainya.
  • Integrasi data lifecycle CDP dan keamanan serta tata kelola SDX

 

CDP Data Visualization

Analis dan tim data science harus dapat membagikan dan menjelaskan hasil analitik dengan cara yang dapat dipahami dan kemudian diterapkan oleh pemangku kepentingan bisnis dengan cepat. Pengguna bisnis juga membutuhkan kemampuan untuk menemukan dan mengkurasi visualisasi mereka sendiri atas data dan model prediktif yang ada oleh mereka sendiri.

CDP Data Visualization menyederhanakan proses kurasi dasbor, laporan, dan bagan visual yang kaya untuk memberikan insight analitis yang agile dalam konteks bisnis, mendemokratisasi akses ke data dan analitik di seluruh organisasi dalam skala besar:

  • Tim teknis bisa membagikan analisis dan model pembelajaran mesin secara cepat dengan cara drag and drop aplikasi interaktif khusus.
  • Tim bisnis dan pengambil keputusan bisnis bisa memakai insight data untuk menghasilkan keputusan bisnis yang terpercaya dan sesuai dengan kebutuhan.
  • Seluruh tim akan mendapatkan benefit dari eksplorasi data yang cepat menggunakan pencarian bahasa alami yang didukung AI dan rekomendasi visual.

 

SF-Admin