DASC

Binnen een paar minuten uw data klaar voor analyse met visueel programmeren en machine learning!

BINNEN EEN PAAR MINUTEN UW DATA KLAAR VOOR ANALYSE MET VISUEEL PROGRAMMEREN EN MACHINE LEARNING!

Rianne Hotting | 15 oktober 2021

SPSS Modeler helpt bedrijven om een snellere time-to-value te realiseren, de productiviteit van data science- en bedrijfsteams te verhogen en ervoor te zorgen dat aan de governance- en beveiligingsvereisten wordt voldaan gedurende de hele levenscyclus van datawetenschap.  


Uw organisatie kan SPSS Modeler gebruiken om analyses uit te voeren, ongeacht waar de gegevens zich bevinden – op locatie of in de cloud – de grootte van de gegevens, of het is gestructureerd of ongestructureerd. Dankzij de schaalbare client-server-architectuur hebben gebruikers toegang tot alles, van platte bestanden tot big data-omgevingen. Analyse wordt teruggeduwd naar de bron voor uitvoering, waardoor gegevensverplaatsing wordt geminimaliseerd en de prestaties worden verbeterd.

Met SPSS Modeler kunnen gebruikers met verschillende vaardigheden samenwerken en doelgerichte use-cases aanpakken om snel tot een beter resultaat te komen. Het biedt analysetechnieken die variëren van voorspellende tot prescriptieve analyses tot geavanceerde algoritmen, waaronder geautomatiseerde modellering, tekstanalyse, entiteiten analytics, sociale netwerkanalyse, beslissingsbeheer en optimalisatie. Een intuïtieve interface is ontworpen voor een breed scala aan gebruikers, van de niet-technische zakelijke gebruiker tot de analytische professional. 

De korte leercurve voor SPSS Modeler maakt het aantrekkelijk voor de beginnende en gevorderde gebruiker, zodat ze snel inzichten krijgen en bedrijfsresultaten realiseren.


Geen zin om het hele artikel te lezen? Bekijk hier de 6 hoogtepunten van SPSS Modeler!

  • Benut de waarde van uw data en vind patronen in meer gegevensbronnen, waaronder tekst, platte bestanden, databases, datawarehouses en Hadoop-distributies in een multi-cloudomgeving
  • Zet meer dan 40 kant-en-klare machine learning-algoritmen aan het werk om de ontwikkeling en het beheer van modellen te vergemakkelijken
  • Integreer met Apache Spark voor snelle in-memory computing
  • Optimaliseer de productiviteit van datawetenschaps- en bedrijfsteams met programmatische, visuele en andere vaardigheden
  • Gegevensanalyse versnellen met prestaties in de database en minimale gegevensverplaatsing met behulp van SQL pushback
  • Breid uw mogelijkheden uit met open source-technologieën zoals R, Python, Spark en Hadoop, met of zonder codering

Wat is Data Science en hoe kan SPSS Modeler hierbij helpen?

In de hyperconcurrerende zakelijke omgeving van vandaag finetunen marktleiders hun investeringen in Data Science om de bedrijfsresultaten te verbeteren. Hierbij kunt u denken aan de volgende voorbeelden van doelen voor data science projecten:

  • Werven en behouden van klanten
  • Operationele efficiëntie stimuleren
  • Minimaliseren en voorkomen van fraude
  • Optimalisatie van wervingsprocessen en vermindering van verloop 
  • Creëren van nieuwe bedrijfsmodellen

Data science is het proces waarbij analytische technieken worden gebruikt om patronen in gegevens te ontdekken en de resultaten toe te passen voor bedrijfswaarde. Beschrijvende analyse, voorspellende modellering, tekstanalyse, geospatiale analyse, entiteitsanalyse, beslissingsbeheer en optimalisatie worden gebruikt om patronen te identificeren en voorspellende modellen in te zetten in operationele systemen. Systemen en mensen kunnen deze patronen en modellen gebruiken om inzichten af ​​te leiden die hen in staat stellen om consequent de juiste beslissing te nemen op het moment van impact. Resultaten worden geoptimaliseerd op basis van de voorspellende intelligentie die verborgen zit in data van toenemende omvang en complexiteit.

SPSS Modeler is een krachtige tool voor visuele Data Science en Machine Learning die is ontworpen om voorspellende intelligentie te bieden bij beslissingen die worden genomen door individuen, groepen, systemen en uw onderneming. SPSS Modeler schaalt van desktop-implementaties tot integratie met operationele systemen om u een reeks geavanceerde algoritmen en technieken te bieden. Het toepassen van deze technieken op beslissingen kan resulteren in een snelle ROI en kan organisaties in staat stellen proactief en herhaaldelijk kosten te verlagen en tegelijkertijd de productiviteit te verhogen.

Toegang tot alle soorten data

Gegevens worden in een exponentieel tempo gegenereerd uit een groot aantal bronnen, waardoor nieuwe informatie en onbenutte kansen worden aangewakkerd voor die organisaties die deze kunnen benutten en de waarde ervan kunnen realiseren. 

Deze gegevens worden opgeslagen in verschillende systemen en formaten, dus het samenbrengen ervan kan een uitdaging zijn. De hoeveelheid gegevens is zo groot dat u deze niet handmatig kunt analyseren en ook niet in tabellen in rapporten kunt kijken om te zien waarom iets wel of niet gebeurt. Het analyseproces vormt nog een andere uitdaging vanwege een gebrek aan bekwame analisten die met de gegevens kunnen werken om de waarde ervan te extraheren.

Met SPSS Modeler kunnen jij en je organisatie de beschikbare data – zowel gestructureerd, ongestructureerd als ruimtelijk – gebruiken, en er waarde uit halen door onbenutte kansen en nieuwe informatie te ontdekken. Met nieuwe inzichten uit uw gegevens kunt u voorspellen wat er waarschijnlijk gaat gebeuren, proactief worden en de resultaten optimaliseren, in plaats van simpelweg te reageren zoals uw huidige situatie dit vereist.

Met SPSS Modeler kunt u een reeks analytische technieken gebruiken om toegang te krijgen tot gegevensbronnen zoals tekst, platte bestanden, databases, datawarehouses en Hadoop-distributies. Deze statistische technieken gebruiken historische gegevens om voorspellingen te doen over huidige omstandigheden of toekomstige gebeurtenissen. Ook inbegrepen zijn mogelijkheden voor gegevenstoegang, gegevensvoorbereiding, gegevensmodellering en interactieve visualisaties. Met geautomatiseerde procedures voor voorbereiding en modellering is het geschikt voor een breed scala aan analysemogelijkheden.

De intuïtieve grafische interface van SPSS Modeler stelt gebruikers in staat om elke stap van het data science-proces te visualiseren als onderdeel van een stream. Door interactie met deze stromen, kunnen analisten en zakelijke gebruikers goed samenwerken, wat zakelijke kennis en domeinexpertise toevoegt aan het datascienceproces. Gebruikers kunnen zich concentreren op het ontdekken van inzichten in plaats van op technische taken zoals het schrijven van code. Ze kunnen ook gedachtenanalyses uitvoeren en gegevens dieper onderzoeken, die alle aanvullende relaties kunnen blootleggen die zinvol zijn voor uw organisatie.

Data preparatie- en manipulatie

Het voorbereiden van gegevens voor analyse is een belangrijke maar tijdrovende stap in de analyse. SPSS Modeler versnelt gegevensvoorbereiding om het proces te vergemakkelijken en om u te helpen ervoor te zorgen dat uw gegevens de beste indeling hebben voor analyse. De geautomatiseerde taken omvatten het analyseren van gegevens en het identificeren van fixes, het screenen van velden, het afleiden van nieuwe attributen waar nodig en het helpen verbeteren van de prestaties door middel van intelligente screeningtechnieken.

SPSS Modeler biedt een grote hoeveelheid manieren om gegevens te manipuleren en voor te bereiden voor analyse op record- of veld- (of variabele) niveau. Om ervoor te zorgen dat uw gegevens de optimale indeling hebben voor het specifieke type vereiste analyse, gebruikt SPSS Modeler deze methoden:

  • Recordbewerkingen: Met Select-, Sample- en Distinct nodes kunt u specifieke gegevensrijen kiezen. U kunt nodes samenvoegen en toevoegen om gegevens samen te voegen door kolommen of rijen toe te voegen aan een dataset. Aggregate en recentheid, frequentie, monetaire nodes vatten records samen in een enkele rij. Een Balance-node past de verhoudingen van records in onevenwichtige gegevens aan en een Sorteerknooppunt herordenen op basis van waarde. De Space Time Box-node creëert geospatiale en op tijd gebaseerde gegevens voor records.
  • Variabelen bewerkingen: Een Type-node specificeert metagegevens en eigenschappen van een dataset, en de Filter node negeert velden. De Derive-node maakt nieuwe velden aan en een Filler-knooppunt kan bestaande veldwaarden vervangen. Gegevens kunnen worden geherstructureerd met de nodes Set to Flag, Om te helpen bij het modelleren, kan de node Partitie de gegevens splitsen en kunnen de nodes Geschiedenis en Tijdsintervallen extra velden maken. De node Veldherschikking definieert de weergavevolgorde om bepaalde velden gemakkelijker te kunnen bekijken.

Wij merken dat er drie groepen te onderscheiden zijn in het updateproces van de software van SPSS:

Het analyse bereik vergroten met een reeks technieken

Analytische technieken blijven zich ontwikkelen en bieden analisten een overvloed aan opties om de problemen die voor hen liggen aan te pakken.  Met SPSS Modeler kunnen uw analisten hun bedrijfsproblemen oplossen met een oplossing die is ontworpen voor eenvoudige beschrijvende analyse, de meest complexe optimalisatieproblemen en alles daartussenin. 

SPSS Modeler biedt mogelijkheden die verder gaan dan de standaard analytische vereisten van hedendaagse analisten en data scientisten. Een reeks van meer dan 40 modellen, visuele drag-and-drop-modellering, ingebouwde gegevensvoorbereiding, tekstanalyse, entiteitsanalyse, sociale netwerkanalyse en de mogelijkheid om modellen op parallelle processen te bouwen, kunnen u allemaal helpen de meest geavanceerde problemen aan te pakken.

Visuele Drag-and-drop modellering voor Data Science

Met de drag-and-drop modelleringsfuncties van SPSS Modeler kunnen ook niet-analisten snel nauwkeurige modellen produceren zonder gespecialiseerde vaardigheden. Bovendien stellen geavanceerde voorspellende modelleringscapaciteiten professionele analisten en data scientisten in staat om de meest geavanceerde streams te creëren.

Met visuele modellering kunt u meerdere modellerings benaderingen vergelijken. Door specifieke opties voor elk modeltype in te stellen (of de standaardinstellingen te gebruiken), kunt u een groot aantal modelcombinaties en opties verkennen. De gegenereerde modellen worden vervolgens gerangschikt op basis van de gespecificeerde maatregel, waarbij de beste voor het scoren of verdere analyse wordt bewaard.

Modellen en algoritmes

SPSS Modeler biedt een scala aan modelleringstechnieken, waaronder de volgende algoritmen:

  • Classificatie-algoritmen: Maak voorspellingen of prognoses op basis van historische data met technieken. Voorbeelden zijn beslissingsbomen, neurale netwerken, logistische regressie, gegeneraliseerde lineaire gemengde modellen en meer. 
  • Segmentatie-algoritmen: Groepeer mensen of detecteer ongebruikelijke patronen met technieken als automatische clustering, anomaliedetectie en clustering van neurale netwerken. Gebruik automatische classificatie om meerdere algoritmen in één stap toe te passen en neem het giswerk weg bij het selecteren van de juiste techniek.
  • Associatie-algoritmen: Ontdek associaties, links of sequenties met Apriori, CARMA en sequentiële associatie.
  • Tijdreeksen en prognoses: Genereer prognoses voor een of meer reeksen in de loop van de tijd met statistische modelleringstechnieken. Met behulp van temporele causale modellering kun je causale verbanden ontdekken tussen een groot aantal reeksen.
  • Uitbreidbaarheid met programmeertalen R en Python: Pas transformaties toe, gebruik scripts om tekst en grafische uitvoer te analyseren, samen te vatten of te produceren met R. Met de Custom Dialog Builder kunt u R- en Python- en Python-code delen en hergebruiken met degenen die ervoor kiezen om geen programmering te gebruiken voor analyse.
  • Monte Carlo simulatie: Houd rekening met onzekerheid in input voor voorspellende modellen. Modelleer onzekere invoer op basis van historische gegevens of met kansverdelingen om gesimuleerde waarden te genereren en gebruik deze vervolgens in het voorspellende model om een ​​uitkomst te genereren. Het resultaat is een verdeling van uitkomsten die antwoorden kunnen geven op vragen die gebaseerd zijn op realistisch gegenereerde data.
  • Entiteitsanalyse: Identificeer relaties en verbeter de samenhang en consistentie van huidige gegevens door identiteitsconflicten in de records zelf op te lossen. Het identificeren van deze relaties kan van cruciaal belang zijn op een aantal gebieden, waaronder klantrelatiebeheer, fraudedetectie, antiwitwaspraktijken en beveiliging.
Geospatiale analyse

Met SPSS Modeler kun je de relatie van gegevenselementen aan een locatie koppelen en een geografische ruimtelijke analyse van uw gegevens uitvoeren om inzichten te onthullen die niet zichtbaar zouden zijn in grafieken of tabellen. Met ruimtelijke analyse kunt u eenvoudig geospatiale gegevens opnemen met behulp van ESRI-vormbestanden. Door zowel niet-ruimtelijke als ruimtelijke gegevens te analyseren, wordt de algehele nauwkeurigheid van het model verbeterd en krijgt u diepere inzichten in mensen en gebeurtenissen.

Voeg een nieuwe dimensie toe aan uw analyse door associatieregels te ontdekken tussen ruimtelijke en niet-ruimtelijke attributen. Met behulp van ruimtelijke temporele voorspelling kunt u lineaire modellen gebruiken voor metingen op locaties in de 2D-ruimte, zodat u gemakkelijk hete gebieden kunt voorspellen en hoe die gebieden in de loop van de tijd kunnen veranderen. U kunt deze technologie toepassen om geospatiale gegevens te ontginnen op gebieden zoals analyse van misdaadpatronen, epidemische surveillance, gebouwbeheer en analyse van brancheprestaties.

Tekstanalyse

De interactieve, visuele omgeving van SPSS Modeler maakt gebruik van geavanceerde taaltechnologieën en Natural Language Processing om ongestructureerde tekstgegevens snel te verwerken. Uit deze tekst worden de belangrijkste concepten geëxtraheerd en geordend. Met de aanpasbare branche specifieke tekstanalysepakketten kunt u bovendien relevante termen en zinnen analyseren naar acroniemen, emoties en vaktaal in de juiste context. 

Interactieve grafieken helpen u tekstgegevens en patronen te verkennen en weer te geven voor directe analyse. U kunt hiërarchische categoriseringsstructuren maken en deze opnemen als input voor een voorspellend model om betere en meer gerichte beslissingen en resultaten te verkrijgen. Vooraf gedefinieerde categorieën, zoals hiërarchieën, annotaties en trefwoorddescriptors, kunnen worden geïmporteerd om initiële ongestructureerde gegevens te categoriseren, zodat u concepten logischer en gedetailleerder kunt ordenen.

Voldoe aan alle behoeften met flexibele modelimplementatie

De inzet van analytics in uw organisatie is afhankelijk van veel omgevingsfactoren. Dergelijke factoren zijn onder meer de zakelijke problemen die moeten worden aangepakt, uw keuze van besturingssystemen en platforms en de andere technologieën en gegevensbronnen in uw infrastructuur. Technologie, en met name software, moet flexibel genoeg zijn om verschillende permutaties aan te kunnen en toch de verwachte prestaties en resultaten te bieden.

De SPSS Modeler-architectuur is een open architectuur die een reeks platforms en talen ondersteunt, waaronder R en Python. U kunt uw oplossing lokaal, vanuit de cloud of zelfs in een hybride cloudbenadering implementeren, en deze vervolgens vol vertrouwen gebruiken met uw bestaande systemen om de prestaties te optimaliseren en uw zakelijke problemen aan te pakken. Deze flexibele implementatie overbrugt de kloof tussen analyse en actie door mensen en processen volgens een schema of op aanvraag resultaten te bieden. 

SPSS Modeler-streams kunnen worden ingezet voor modelvernieuwing of geautomatiseerde taakplanning. Ontwikkelaars kunnen SPSS Modeler-streams insluiten in Java-applicaties met behulp van de embedded predictive modeling Java API. 

Optimalisatie Data Science projecten

Zelfs de meest toegewijde organisatie kan het zich niet veroorloven om elke klant naar voren te halen, en evenmin kan een verzekeraar elke claim onderzoeken. Bedrijven opereren onder reële beperkingen, onderhevig aan limieten voor beschikbaar personeel, apparatuur en investeringen. Optimalisatie stelt organisaties in staat om het beste uit schaarse middelen te halen door de oplossing te identificeren die het beste aansluit bij een specifiek doel. Voorbeelden hiervan zijn het maximaliseren van de opbrengst van een marketingcampagne of het minimaliseren van het risico op fraude of churn. Optimalisatie kan op aanvraag worden gebruikt, bijvoorbeeld voor een persoon om de beste aanbieding voor die persoon te bepalen, of in batch om aanbiedingen toe te wijzen aan alle in aanmerking komende klanten.

Uitvoering en planning van het Data Science project

SPSS Modeler bevat mogelijkheden om automatisering te gebruiken om uw resultaten consistenter te maken. Een grotere consistentie versterkt het vertrouwen van mensen in analyses, omdat het management de zakelijke omgevingen waar analytische processen plaatsvinden efficiënt kan besturen. Deze governance helpt ervoor te zorgen dat aan alle interne en externe procedurele vereisten wordt voldaan.

Met SPSS Modeler kunnen analisten flexibele, herhaalbare analytische processen construeren die kunnen worden geoperationaliseerd, dat wil zeggen op het juiste moment gestart en geïntegreerd met andere bedrijfsprocessen. Vooraf gedefinieerde modelbeheerprocessen helpen modellen relevant en nauwkeurig te blijven.

Database mogelijkheden

SPSS Modeler biedt een aantal mogelijkheden om gegevensverplaatsing te minimaliseren en analyses naar de database te pushen, zoals:

  • SQL-pushback maakt transformatie en voorbereiding van gegevens in de database mogelijk zonder de noodzaak om SQL te schrijven of te programmeren. Het resultaat is een aanzienlijke verbetering van de analytische prestaties.
  • Databasefuncties. SPSS Modeler kan gebruik maken van bijna alle door de gebruiker gedefinieerde functies, database-aggregatie en windowed-aggregatiefuncties die door een database worden geleverd. Deze worden weergegeven door de SPSS Modeler-werkbank om de beschikbare native functionaliteit uit te breiden en ervoor te zorgen:
  • SQL-pushback analyse in de database. SPSS Modeler Server ondersteunt integratie met de analysemogelijkheden, modelleringstools en database-native algoritmen die beschikbaar zijn. Je kunt modellen bouwen, scoren en opslaan in de database, allemaal vanuit de SPSS Modeler-werkbank.
Conclusie

SPSS Modeler biedt een data science platform wat u kan ondersteunen bij alle fases van een data science project. Het vergemakkelijkt het samenwerken tussen diverse specialisten en werkt naadloos samen met database systemen. Door aan de slag te gaan met SPSS Modeler bespaart u veel tijd, heeft u uitstekend versiebeheer en bent u in staat om gebruik te maken van alle kennis binnen uw organisatie.

Bent u benieuwd geworden naar SPSS Modeler en wilt u graag meer informatie ontvangen of een demo krijgen van de software? Neem dan contact met ons op via onderstaande buttons.

In dit artikel:

  • Hoogtepunten van SPSS Modeler
  • Wat is Data Science ?
  • Toegang tot data
  • Data preparatie en manipulatie
  • Analyse bereik vergroten
  • Visuele Drag-and-drop modellering
  • Modellen en algoritmes
  • Geospatiale analyse en tekstanalyse
  • Flexibele modelimplementatie
  • Modeloptimalisatie
  • Uitvoering en planning van het Data Science project
  • Database pushback

Wilt u graag reageren op dit blog? Dit blog is ook als artikel geplaatst op de DASC pagina op LinkedIn, u kunt hier uw reactie achterlaten.