Il Programma Software in Silicon dedicato agli sviluppatori

redazione

Per supportare gli sviluppatori nella realizzazione della nuova generazione di piattaforme per l’analisi dei big data, Oracle ha rilasciato API aperte e gratuite e il developer kit della propria tecnologia Data Analytics Accelerator (DAX) sui processori SPARC attraverso il Programma Software in Silicon dedicato agli sviluppatori, che consente loro di consultare alcuni casi di utilizzo, il codice di programmazione, di fare test e validare come DAX può accelerare le applicazioni di analisi dei dati testando anche la tecnologia Software in Silicon.
 
"Nell’analisi dei dati è fondamentale disporre di ottime performance come nel caso dell’analisi dei dati relativi ai clickstream, del sentiment sui social media, dei comportamenti di acquisto e altro ancora”, ha dichiarato John Fowler, Executive Vice President Systems di Oracle. "Grazie al nostro programma Software in Silicon dedicato agli sviluppatori, questi ultimi possono ora utilizzare la nostra tecnologia DAX in una serie di situazioni che prima non potevano essere risolte. Ciò è possibile perché abbiamo integrato nei processori l’accelerazione dell’analisi dei dati raggiungendo una velocità di scansione dei dati senza precedenti fino a 170 miliardi di righe per secondo". 

Con il rilascio del processore SPARC M7 a 32-core e 256 thread, Oracle ha creato una serie di funzionalità del Software in Silicon grazie alla creazione di funzioni software di livello superiore integrate nel processore stesso. Una delle funzionalità più interessanti introdotte nel processore SPARC M7, come parte delle innovazioni del Software in Silicon, è rappresentata da DAX che offre un’efficienza di analisi senza precedenti.
 
Acceleratore dell’analisi dei dati integrato nel processore SPARC M7
DAX aggiunge capacità di elaborazione in grado di eseguire funzionalità selettive – scansione, estrazione, selezione e traduzione – a una velocità incredibilmente elevata. SPARC M7 DAX accelera queste analisi iniziali su un’unità fisica dedicata separata dai core di calcolo standard.
 
Lo sviluppo iniziale del software riguarda DAX per Oracle Database 12c e tutte le relative applicazioni, ampliando l’accelerazione dell’analisi a tutte le applicazioni Oracle, degli ISV e dei clienti.

Le operazioni di scansione e filtraggio su larga scala sono semplificate grazie a un uso trasparente dei 32 co-processori dedicati DAX all’interno del microprocessore SPARC che operano a velocità di bus di memoria fino a 160 GB/s tra cache e DRAM. Questi acceleratori, implementati per la prima volta on-chip per ottenere il massimo livello di prestazioni ed efficienza, possono ora essere utilizzati dagli sviluppatori grazie alle API di Oracle Solaris 11 e impiegati per una varietà di usi.
 
Come interessante esempio di integrazione di DAX nell’ambito dell’apprendimento automatico (machine learning) e dei Big Data, i progettisti Oracle hanno dimostrato che DAX può accelerare in modo significativo Apache Spark, è uno dei metodi più diffusi per l’elaborazione dei dati su larga scala. Attraverso questo progetto, gli ingegneri hanno utilizzato DAX con Apache Spark per tenere in memoria un miliardo di righe di dati e filtrarli in un cubo di dati tridimensionale così velocemente da rendere possibile l’analisi interattiva dei dati.
 
Di seguito alcuni dei punti di forza di SPARC M7 e DAX:

  • La miglior larghezza di banda della memoria disponibile: con una larghezza di banda della memoria di 160 GB/s, il processore SPARC M7 offre una capacità sufficiente ad alimentare sia l’unità DAX sia il core del processore.

  • Offload DAX: libera i core del processore per altre attività di calcolo.

  • Decompressione efficiente combinata con l’elaborazione in-memory: effettuare la decompressione nell’unità DAX è molto più veloce dell’implementazione software. Progettare la decompressione con la scansione evita inutili trasferimenti di memoria. I risultati ottenuti da DAX vengono inseriti nella cache della CPU per una migliore efficienza della CPU stessa.

  • Confronti delle prestazioni DAX: molte query di analisi del database vengono scritte per individuare i dati che vengono scambiati in determinati intervalli di tempo o in base alle fasce di costo dei prodotti, ecc. DAX elabora vari processi di confronto dei dati alla stessa velocità di un singolo processo. Altri processori necessitano di ulteriore tempo per processare ogni confronto. 

  • Nessuna corruzione della cache: DAX effettua gran parte dei calcoli senza la necessità di memorizzare i dati intermedi in una cache, liberando la cache della CPU per altre elaborazioni.

Collaborazione con la community degli sviluppatori e con istituti d’istruzione superiore

Oracle è attivamente impegnata a potenziare i processori tradizionali per migliorare le prestazioni dei carichi di lavoro raggiungendo oltre 20 record a livello mondiale rispetto alla concorrenza. Software in Silicon è in grado di fornire miglioramenti delle funzioni a gradino, in precedenza impossibili, necessari in aree come la sicurezza e l’analisi dei dati grazie all’embedding di funzionalità che vanno a gestire algoritmi particolari sul processore con maggiori prestazioni e una migliore efficienza.
 
Oracle ha anche reso pubblici numerosi casi di utilizzo con esempi di codice per massimizzare la produttività degli sviluppatori e accelerare i progetti, oltre a un esempio dettagliato di integrazione tra DAX e Apache Spark. Le risorse sono accessibili grazie al Software in Silicon su Cloud di Oracle: un servizio cloud gratuito per sviluppatori e ricercatori che fornisce l’accesso diretto a questa tecnologia. Inoltre, Oracle sta collaborando con i principali istituti di istruzione superiore, come la Brown University, per progetti di ricerca innovativi basati su Software in Silicon.
 
"Attualmente stiamo lavorando per caratterizzare le prestazioni di DAX attraverso una serie di moderni schemi di layout dei dati in-memory. Al termine di questo studio, lavoreremo sull’utilizzo ottimale di DAX per accelerare l’esplorazione e la visualizzazione interattiva dei dati con il database main-memory Tupleware e il sistema di elaborazione in tempo reale dei flussi S-Store", ha dichiarato Ugur Centimenel, Chairman of the Computer Science Department, Brown University. "Grazie a questi studi potremo quantificare la prestazioni e la scalabilità di M7 e DAX sui carichi di lavoro reali che coinvolgono un sofisticato sistema di ricerca e di apprendimento automatico su grandi quantità di dati".
 
Le API aperte per Oracle DAX sono ora disponibili gratuitamente tramite Software in Silicon Cloud. Gli sviluppatori possono entrare a far parte della community e iniziare a sviluppare la nuova generazione di applicazioni per big data e analisi.