Cloudera: Data Science Workbench per accelerare data science e apprendimento automatico nelle imprese

Redazione

Cloudera, fornitore globale della piattaforma di analisi, gestione dei dati e apprendimento automatico più veloce, semplice e sicura basata sulle più recenti tecnologie open source, ha annunciato la disponibilità generale di Cloudera Data Science Workbench, lo strumento self-service dedicato ai data scientist. La soluzione, in versione beta nel corso di Strata + Hadoop World San Jose 2017, mette a disposizione delle imprese una data science veloce, facile e sicura in modalità self-service.

“Stiamo entrando nell’era d’oro dell’apprendimento automatico e tutto è incentrato sui dati. Tuttavia, i data scientist continuano a faticare per creare e testare nuovi progetti analitici alla velocità desiderata, soprattutto in ambienti di grandi dimensioni”, ha affermato Charles Zedlewski, vice president senior Products di Cloudera. “Data Science Workbench è uno strumento self-service che accelera la capacità di creare, scalare e implementare soluzioni di apprendimento automatico utilizzando le tecnologie più potenti. Ciò significa che i data scientist oggi hanno la libertà di collaborare, condividere e gestire i propri dati nella modalità che meglio si adatta alla loro attività e alla loro azienda, agevolando un percorso più semplice e veloce per la produzione”.

Grazie a Python, R e Scala direttamente nel browser web, Cloudera Data Science Workbench offre un’esperienza di data science self-service, assicurando agli utenti la possibilità di scaricare e sperimentare le librerie e i framework più recenti in ambienti di progetto personalizzabili. Cloudera Data Science Workbench è sicuro e compatibile, con supporto per l’autenticazione, l’autorizzazione, la crittografia e la governance in Hadoop.

L’ufficio delle statistiche nazionali (ONS), il più grande produttore indipendente di statistiche ufficiali del Regno Unito, mira a utilizzare Cloudera Data Science Workbench per creare ricerche statistiche ripetibili, precise e trasferibili. “Abbiamo accertato un tempo inferiore nello sviluppo di modelli e una maggiore visibilità nel monitoraggio dei progressi e dei risultati”, afferma Simon Sandford-Taylor, Chief Technology Officer. “Riteniamo che Cloudera Data Science Workbench abbia il potenziale per accelerare il nostro calendario di rilascio e per condividere meglio le best practice”.

“I clienti enterprise richiedono una piattaforma logica per scalare le proprie soluzioni di analisi e massimizzare gli investimenti. L’integrazione nativa di BigDL con Apache Spark porta il mondo del deep learning nell’ecosistema di Apache Spark e un valore più elevato per i clienti aziendali”, ha dichiarato Michael Greene, vice president e general manager System Technologies and Optimization del gruppo Software and Services, Intel Corporation. “Il framework BigDL aiuterà i clienti aziendali a utilizzare meglio gli investimenti esistenti per creare le proprie competenze analitiche con prestazioni ottimizzate sull’architettura Intel®”.

I vantaggi dell’integrazione di BigDL in Data Science Workbench includono la capacità di sfruttare le librerie e le tattiche di deep learning sull’architettura della CPU senza ulteriori necessità hardware o ambienti separati. La combinazione, infatti, fornisce un modo conveniente per creare pipeline data science Spark in modo nativo e integrarle con la libreria di deep learning (BigDL) e altri componenti Spark/Hadoop sulla soluzione Cloudera Data Science Workbench.