Saturday, 10. February 2007Anspruchsvoll
Wer wagt, der gewinnt nicht immer. Ich habe es immerhin versucht und habe erfahren:
Die Minimalvoraussetzungen für die Installationen der Datawarehouse Edition auf einem Rechner sollte man nicht drastisch unterschreiten. Bei zu wenig RAM legt sich nach erfolgter Installation die Konfiguration der DWE-Komponenten schlafen. Der Versuch den WAS zu starten stößt an die Grenzen des physikalischen Arbeitsspeichers. Der DWE 9.1.1 Installation Guide verrät unter "Installation Requirements" die Hardware-Anforderungen der DWE-Komponenten: "Anspruchsvoll" vollständig lesen
Geschrieben von Axel Holzmüller
in DB2 Data Warehouse Edition
um
18:23
| Kommentare (0)
| Trackbacks (0)
Tags für diesen Artikel: dwe, installation
Sunday, 4. February 2007Was gibt's Neues in DWE 9.1.1 (# 18: Miningblox)
Nach dem ich mich schon hinreichend über die neuen Algorithmen für das Data Mining in der Data Warehouse Edition gefreut habe, gibt es mit den "Miningblox" als weitere herausragenden Neuerung einen weiteren Anlass zu froher Erwartung.
"Miningblox: Miningblox tags extend Alphablox functionality with data mining. IBM provides a toolkit and a framework for BI developers so they can easily create custom mining solutions for their business users by using Web applications. The complexity of mining is hidden behind a common Web interface that empowers business users to use data mining without needing to install a database on their own systems."Mit Miningblox wird also die Erstellung von Data Mining-Anwendungen erleichtert, die auf einem Application Server unternehmensweit zur Verfügung gestellt werden können. Das klingt nach wahrhaftigem "Data Mining for the masses", keine komplexen Software-Installationen auf allen Rechnern, die auf Mining-Analysen zugreifen sollen. Als Frontend genügt ein Browser. Die Mining-Analysen laufen weiterhin in der Datenbank, hier unter Kontrolle eines Application Servers, der mittels Alphablox die Mining-Ergebnisse dem Anwender zur Verfügung stellt. Aber bis dahin muss ich noch einige Steine aus dem Weg räumen: "On the DWE WebSphere application server, you must manually deploy the Miningblox Framework. For more information, see the file readme.txt in the Das klingt nach zusätzlicher Arbeit.
Geschrieben von Axel Holzmüller
in DB2 Data Warehouse Edition
um
22:55
| Kommentare (0)
| Trackback (1)
Tags für diesen Artikel: data mining, dwe
Friday, 26. January 2007Post Migration Task
Die Empfehlung, alle Design Studio Workspaces von DWE 9.1 nach 9.1.1 zu migrieren macht schon Sinn. Auch wenn ich bisher fast ohne Probleme 9.1 Workspaces öffnen konnte, häufen sich nun Meldungen über Inkompatibiliäten.
Tatsächlich habe ich bisher in den mit 9.1 erstellten Projekten keine Änderungen vorgenommen, die ich hätte speichern wollen oder müssen. Ich bin also bisher gut ohne Speichern oder auch das angemahnte Migrieren von Projekten ausgekommen. Es war schon irritierend, das im Datenbank-Explorer immer noch Verbindungen mit Datenbanken der DB2-Version 8.2 gelistet wurden, obwohl ich diese längst nach DB2 9.1 migriert hatte. Aber diese Kleinigkeit lässt sich durch ein wenig Handarbeit bereinigen. Die Meldungen "Fehler beim Speichern" allerdings, die bei Änderungen an Mining-Flows erscheinen, sind nun der mehr oder weniger freundliche Hinweise, sich der letzten verbliebenen Nach-Installationsaufgabe zu widmen: "Migrating Design Studio workspace projects from DWE 9.1 to DWE 9.1.1" Einfach unter "Datei" "Arbeitsbereich wechseln ..." auswählen und in der folgenden Eingabeaufforderung das Stammverzeichnis für den neu anzulegenden Workspace eintragen. Danach wird das Design Studio mit dem neuen Arbeitsbereich gestartet. "Post Migration Task" vollständig lesen
Geschrieben von Axel Holzmüller
in DB2 Data Warehouse Edition
um
16:43
| Kommentare (0)
| Trackbacks (0)
Tags für diesen Artikel: DWE, installation
Thursday, 25. January 2007Die Wiederkehr der Kohonenkarte
Der "mittelpunktbasierte" Clusteralgorithmus mit einer Kohonen-Karte lässt sich durch verschiedene Parameter beeinflussen. In den Mining-Einstellungen des Clusterer-Operators wird nach Auswahl von "Kohonen" als Algorithmus "Anzahl Durchgänge" angeboten. Die maximale Anzahl Cluster ist als Vorgabe für beide Segementierungsverfahren vorgesehen.
Bleiben noch die beiden Größen für die Bestimmung des "Zuordnungslayout": LayoutNumRows und LayoutNumColumns. Hierfür bietet der Clusterer-Operator keine eigenen Eingabefelder an. Es bleibt also nur die Spezifikation der Layoutwerte mittels "Optionale Parameter". Und das ist nicht trivial, da sollte man schon mal die Online-Hilfe zu Rate ziehen. Die rät einem mehr oder weniger verklausoliert zu DM_setAlgorithm('Kohonen','<LayoutNumRows>4</LayoutNumRows><LayoutNumColumns>5</LayoutNumColumns>'). Zumindest habe ich keine bessere Variante gefunden. "Die Wiederkehr der Kohonenkarte" vollständig lesen
Geschrieben von Axel Holzmüller
in DB2 Data Warehouse Edition
um
21:08
| Kommentare (0)
| Trackbacks (0)
Tags für diesen Artikel: data mining, dwe
Saturday, 20. January 2007Was gibt's Neues in DWE 9.1.1 (# 17)
Neural Networks are back!
"Kohonen Clustering: The Clusterer operator now provides the neural Kohonen Clustering algorithm."Dies ist ja eigentlich kein neuer Algorithmus: Das Clustern mit der Kohonen Karte kannte schon der gute, alte Intelligent Miner for Data. Ich habe dieses Verfahren oft als Alternative zur demographischen Segmentierung benutzt, die jeweils gebildeten Gruppen verglichen und mich dann doch meistens für das Ergebnis des demographischen Algorithmus entschieden. Aber eben nur meistens. Es kann nicht falsch sein, zu einer Mining-Aufgabe verschiedene Verfahren zur Verfügung zu haben. So kann man sich einen besseren Überblick über das Problemfeld verschaffen. Ich habe als Alternative zu einer Baumklassifikation, die die vor einigen Wochen erstellt hatte, testweise eine Naive Bayes-Klassifikation durchgeführt. In diesem Falle war ich mit dem neuen Ergebnis nicht sonderlich zufrieden, obwohl der Visualizer durchweg bessere Qualitätswerte ausweist. Denn die im Feldbedeutungsdiagramm angegebenen Einflüsse der Variablen waren und sind im Falle der Baumklassifikation realistischer. "Was gibt's Neues in DWE 9.1.1 (# 17)" vollständig lesen
Geschrieben von Axel Holzmüller
in DB2 Data Warehouse Edition
um
23:05
| Kommentare (0)
| Trackbacks (2)
Tags für diesen Artikel: data mining, DWE
Friday, 19. January 2007Was gibt's Neues in DWE 9.1.1 (# 15 und 16)
Und nun zum Höhepunkt des DWE Refresh - zumindest aus meiner Sicht: die neuen "Data mining features". Ich meine damit nicht, dass die anderen Neuerungen marginal sind. Im Gegenteil, schon alleine die bisher beschriebenen Erweiterungen sind mehr als ich von einem "Refresh" erwarte. Von einem hunderstel Upgrade kann man höchstens etwas mehr als nur Fehlerkorrekturen erwarten.
Neue Mining-Algorithmen berechtigen eigentlich zu mehr als nur einem Hunderstel, z.B. zu 9.2 oder 9.5 oder gar zu 10.0. Dieses Refresh bring für mich mehr als eine komplette neue Windows-Version. Vista bringt die Menschheit nicht voran, wenn man mal von Intel oder AMD absieht. Lieber ein neuer Mining-Algorithmus als Tausend angeblicher Verbesserungen am GUI. MS ist doch inzwischen mehr damit beschäftigt, selbst aufgerissene Löcher zu stopfen als wirkliche Innovationen zu auszuliefern. Aber das ist ein weites Feld. Ich komme lieber zurück zu den wichtigen und interessanten Dingen im IT-Leben, hier zu der Naive Bayes Klassifikation in der Data Warehouse Edition: "Naive Bayes classification: The classification of information that is gathered from non-structured documents is a key element of structured and unstructured mining analysis. This algorithm provides this functionality with best acceptance throughout the industry. Naive Bayes classification is supported in the predictor operator."Das ist eine Bereicherung für die Vorhersage kategorialer Variablen. Hier gab es bisher nur die Baum-Klassifikation, während zur Vorhersage kontinuierlicher Attribute sich gleich drei Verfahren anbieten. Es ist immer gut, eine Alternative zu haben. Trotz "naiver" Unabhängigkeitsannahmen liefert Naive Bayes häufig gute Ergebnisse. Das ist aber noch nicht alles: "Was gibt's Neues in DWE 9.1.1 (# 15 und 16)" vollständig lesen
Geschrieben von Axel Holzmüller
in DB2 Data Warehouse Edition
um
14:57
| Kommentare (0)
| Trackback (1)
Tags für diesen Artikel: data mining, dwe
Sunday, 7. January 2007Was gibt's Neues in DWE 9.1.1 (Data Mining Prolog)
Der DWE Data Miner war schon zu Zeiten des Intelligent Miners for Data ein Weltklasse Mining-Werkzeug. Allerdings gab es seit der Version 6.x des IM im Bezug auf Analyse-Funktionalität keine Neuigkeiten mehr. Statt dessen wurden die Mining-Methoden in DB2 als Intelligent Miner for Modelling und Scoring integriert.
In dieser Zeit - und die begann spätesten im Jahre 2000 - behaupteten andere Hersteller von Data-Mining-Software, dass IBM die Entwicklung eines eigenen Werkzeuges ausgegeben habe. Ich erinnere mich, dass in diesem Zusammenhang häufig SAS genannt wurde. Ich war zu der Zeit und bin auch noch der Ansicht, dass IBM dem hätte offensiver entgegentreten müssen. Denn die, wie sich herausstellen wird, haltlosen Behauptungen mancher Wettbewerber wie SAS, SPSS, Oracle und neuerdings Microsoft grenzten schon an wettbewerbsschädigendem Verhalten. Doch die DWE 9.1 und vor allem das Refresh sprechen eine deutliche Sprache. Die Integration von Mining-Technologie in das Data Warehouse-Umfeld ist aus meiner Sicht mehr als gelungen. Ich vermisse den Intelligent Miner for Data fast überhaupt nicht mehr. Die Abbildung des gesamten Data Mining-Prozesses, angefangen bei der Datenakquisition bis hin zur Darstellung der Ergebnisse, ist im Design Studio wesentlich einfacher und transparenter zu gestalten, als es vor der Version 9.1 der Fall war. Mit DWE Version 9.1 habe selbst ich eingesehen: Die Mining Work Bench a la Intelligent Miner for Data ist tot, es lebe die Integration von mathematischer Intelligenz ins Data Warehousing. Der Refresh bringt nun drei neue Mining-Algorithmen. Das gab es schon seit langem nicht mehr, dass die Kernfunktionalität des Miners erweitert wurde. Dazu kommen noch mit den Miningblox eine Neuerung, die die Darstellung von Mining-Ergebnissen ins Reporting-Umfeld integriert. Das ist doch nicht normal für einen Refresh. "Was gibt's Neues in DWE 9.1.1 (Data Mining Prolog)" vollständig lesen
Geschrieben von Axel Holzmüller
in DB2 Data Warehouse Edition
um
20:31
| Kommentare (0)
| Trackbacks (4)
Was gibt's Neues in DWE 9.1.1 (# 10 bis 14)
Bevor ich zu den mit Spannung erwarteten neuen "Data mining features" komme, werden hier noch die letzten Neuerungen im "SQL Warehousing Tool" zitiert. Es handelt sich hierbei um acht neue Operatoren für Steuerungsflüsse.
"Stored procedure: This operator runs a specified DB2 stored procedure."Klingt sinnvoll, das haben sicher einige 9.1-Anwender vermisst. "Variable comparison: This operator performs compares an input variable with another value to determine conditional processing behavior in the flow."Das erscheint geradezu selbstverständlich, wenn man schon in den Operatoren eines Steuerungsflusses mit Variablen arbeiten kann. "Break, continue, and fail: These operators emulate Java programming semantics to perform conditional processing."Das haben sich wohl viele DWE-Entwickler gewünscht. "Reorg and runstats: These operators run the DB2 REORG and RUNSTATS commands on specified tables and indexes."Was kann man neuerdings mit einem Reorg anstellen? Tabellen zeilenkomprimieren! "Period row generator: This operator generates rows that contain specified datetime columns and appends them to a time dimension table"Mal sehen, was man damit so alles anstellen kann.
Geschrieben von Axel Holzmüller
in DB2 Data Warehouse Edition
um
14:58
| Kommentare (0)
| Trackback (1)
Tags für diesen Artikel: dwe
Saturday, 6. January 2007Oops
Auf das Kapitel "What's new in DWE 9.1.1" folgt die Überschrift "Migrating Design Studio workspace projects from DWE 9.1 to DWE 9.1.1". Das klingt nach mehr "Post-Installation"-Arbeit.
Nun war ich allzu neugierig herauszufinden, was seit der Version 9.1 so alles hinzugekommen ist. Dazu habe ich natürlich im Design Studio das eine oder andere Projekt geöffnet. Das war wohl etwas voreilig. Denn gleich im ersten Satz unter besagtem Titel heißt es: "Do not try to open a Version 9.1 workspace directly in Version 9.1.1 of the Design Studio."Warum nicht? Was passiert, wenn doch? Ich wüsste doch gerne, welche Veränderungen die Ursache für diese Warnung sind. Und es kommt noch schlimmer: 1. Export all of the projects from the Version 9.1 workspace, including referenced projects, before installing Version 9.1.1 of the Design Studio.Tatsächlich habe ich meine Version 9.1 komplett nach 9.1.1 migriert ohne auch nur einen Worspace vorher zu exportieren. Danach habe ich auch noch mindestens zwei Projekte geöffnet. In einem wurde anstatt des Diagramms zu einem Datenfluss das dazugehörige xml-Dokument auf der Arbeitsfläche angezeigt. Die Ursache hierfür hatte ich allerdings nicht auf die Migration zurückgeführt. "Oops" vollständig lesen
Geschrieben von Axel Holzmüller
in DB2 Data Warehouse Edition
um
22:19
| Kommentare (0)
| Trackback (1)
Tags für diesen Artikel: dwe, installation
Friday, 5. January 2007Was gibt's Neues in DWE 9.1.1 (# 8 und 9)
Hier die letzten beiden Punkte aus der Liste der "Data flow enhancements":
"Sampling data: For operators that provide table properties, you can view sample data directly from the data flow editor." Auch dieses Feature ist dem Mining-Fluss-Editor entlehnt, und das zu recht. In einem Mining-Fluss findet man es in Kontext-Menü eines geeigneten Operators unter "Daten" und "Beispielinhalt ...". Im Datenfluss-Editor heißt der Eintrag "Stichprobe des Datenbanktabelleninhalts entnehmen". "Background flow execution in the Design Studio: You can run data flows and control flows in the background, and you can cancel control flows between operators. The new Execute Status view displays execution results."Dies ist neu für Datenflüsse, für Mining-Flüsse konnte und musste ich diese Option bereits nutzen, da Mining manchmal etwas länger braucht. Bei letzten drei Erweiterungen für Datenflüsse wurden Funktionalitäten aus den Mining Flows übernommen. Das sollte aber nicht das Ende sein: Ich vermisse auf jeden Fall noch "Bis zu diesem Schritt ausführen ...".
Geschrieben von Axel Holzmüller
in DB2 Data Warehouse Edition
um
15:22
| Kommentare (0)
| Trackback (1)
Tags für diesen Artikel: dwe
Was gibt's Neues in DWE 9.1.1 (# 7)
Dies ist die Nummer 7 in der Liste der "Data flow enhancements":
"Creating suitable tables: Like the mining flow editor, the data flow editor now allows you to automatically create a suitable table for the data that is passing through operator output ports."Das ist eine der Besonderheiten, die das Arbeiten mit Mining-Fluss-Editor so bequem machen. Nach rechtem Mausklick auf den Ausgabeport eines geeigneten Operators und Auswahl von "Geeignete Tabelle erstellen ..." erscheint der bekannte hilfreiche Assistent. Auch wenn das Vorgehen für beide Flüsse auf den ersten Blick gleich aussieht, gibt es doch kleine, aber feine Unterschiede. Das geht gleich auf der ersten Seite des Dialogs los: Aus einem Mining-Fluss aufgerufen findet man dort die Check-Box "Tabellenzieloperator automatisch erstellen und verbinden", in einem Datenfluss erscheint dort "Wählen Sie diese Option, um die Tabelle im Datenmodell und in der Ausführungsdatenbank zu erstellen. Nehmen Sie". Ich wüsste gerne, was ich nehmen soll oder kann. Da hilft sicher ein Blick in die englische Version, die Online-Hilfe tut's nicht. "Was gibt's Neues in DWE 9.1.1 (# 7)" vollständig lesen
Geschrieben von Axel Holzmüller
in DB2 Data Warehouse Edition
um
13:16
| Kommentare (0)
| Trackbacks (0)
Tags für diesen Artikel: dwe
Thursday, 4. January 2007Was gibt's Neues in DWE 9.1.1 (# 5 und 6)
Und noch mehr "Data flow enhancements":
"Saving flows as images: You can save flow diagrams (data flows, control flows, and so on) as image files."Einfach rechter Mausklick auf dem Panel (dem "Erstellungsbereich" des Daten- oder Steuerungsflusses), "Datei" und "Als Imagedatei speichern ..." auswählen, ausfüllen und los. Ein hilfreiches Feature für Dokumentationswütige und Leute, die ihre Elaborate gerne publizieren. Im Ernst: wenn es diese Möglichkeit ab jetzt nicht geben würde, hätte ich sie sicher demnächst schmerzlich vermisst. "Expanded variable support: In data flows and control flows, several new properties can be set as variables, and the SQL Expression Builder includes a Variables section."In den Eigenschaften eines Datenflusses gilt dies für die zwei (evtl.) neuen Felder für "Tabellenbereiche" sowie für Felder einiger Operatoren. Im Steuerungfluss trifft das wohl auf den einen oder anderen Operator zu. Zu einer sicheren Aussage über solche Erweiterungen fehlt mir der Vergleich mit der Version 9.1. Die habe ich ja hier mit dem Refresh überbügelt. Offensichtlich ist der erweiterte "variable support" im SQL Expression Builder. Dieser kommt als "SQL Code Builder", "SQL Condition Builder" oder anders überall dort zum Einsatz, wo SQL-Ausdrücke erstellt werden sollen. Hier gibt es jetzt auf der rechten Seite eine neue Box unter der Überschrift "Variablen".
Geschrieben von Axel Holzmüller
in DB2 Data Warehouse Edition
um
16:24
| Kommentare (0)
| Trackbacks (2)
Tags für diesen Artikel: dwe
Wednesday, 3. January 2007Was gibt's Neues in DWE 9.1.1 (# 2 bis 4)
Dies sind drei weitere Neuerungen aus dem Bereich "Data flow enhancements":
"Table source filtering: You can apply a WHERE clause condition to the data that is read in from a source table."Einfach praktisch, das erspart einen gesonderten Operator auf der Arbeitsfläche. Im Tabellenquelle-Operator gibt es dazu in der Markmalsicht die neue Seite "Bedingung WHERE". "Commit intervals: For SQL Insert operations, you can specify a commit interval in the table target operator."Dahinter verbirgt sich das neue Eingabefeld "Commitintervall" auf der "allgemeinen" Eigenschaftenseite des Tabellenziel-Operators. Hier kann die Anzahl eingefügter Zeilen spezifiziert werden, nach denen ein Commit ausgeführt wird. Da musste aber einiges an der Code-Generierung für das Insert geändert werden. "Exploitation of the DB2 Database Partitioning Feature (DPF): To improve the performance of data flows and certain data flow operators (such as distinct and splitter operators), the SQL Warehousing Tool generates partition-aware code based on properties specified in the data flow."Ich denke, dazu ist die Check-Box "DB2-Datenbankpartitionierungsfunktion (DPF) verwenden" vorgesehen. Das gleiche gilt für die Merkmalsicht-Seite "Einstellungen für die Zwischenspeichertabelle" der Operatoren "Eindeutig" (Distinct), "Verteilerprozess" (Splitter) und "Schlüsselsuche" sowie die Seite "Partitionierungsoptionen" der Operators "Massenladeziel" und "Dateiimport" (wobei sich mir nicht erschließt, was genau unter dem Feldnamen "Partitionierungspartitionen" zu verstehen ist).
Geschrieben von Axel Holzmüller
in DB2 Data Warehouse Edition
um
15:33
| Kommentare (0)
| Trackback (1)
Tags für diesen Artikel: dwe
Was gibt's Neues in DWE 9.1.1 (# 1)
Dies wird die lange Antwort zu dieser kurzen Frage. Lang, da die Liste der Neuerungen und Änderungen recht umfangreich ist mit 34 Einträgen. Wie obiger Titel vermuten lässt, wird sich die Antwort wohl auf mehrere Blogeintäge verteilen.
Die meisten Änderungen findet man unter der Überschrift "SQL Warehousing Tool features" und dort zum Thema "Data flow enhancements". Und hier geht es gleich mit einer sehr sinnvollen und hilfreichen Erweiterung los: "Flat file discovery: You can sample a file in the file import operator and automatically generate its schema, instead of manually defining columns and data types."Konkret ist hier der neue Knopf "Dateiformat generieren" auf der Dateiformat-Seite des Dateiimport-Operators gemeint. Damit wird ein Dialog gestartet, in dessen Verlauf die Liste der zu importierenden Felder mit wenigen Eingaben komfortabel generiert werden kann. Diese Erweiterung ist ohne Frage sehr hilfreich. Ich hatte einen solche Unterstützung bereits vermisst, da z.B. Access seit langem über einen solchen Assistenten zur Erstellung von csv-Dateien verfügt. "Was gibt's Neues in DWE 9.1.1 (# 1)" vollständig lesen
Geschrieben von Axel Holzmüller
in DB2 Data Warehouse Edition
um
14:30
| Kommentare (0)
| Trackback (1)
Tags für diesen Artikel: dwe
Tuesday, 2. January 2007Was gibt's Neues in DWE 9.1.1 (Prolog)
Hier die kurze Antwort auf die kurze Frage: Sehr viel für ein hundertstel Upgrade.
Wie bereits an anderer Stelle ausgeführt, ist der wichtigste Grund für den Refresh die Einbindung einiger neuen Features der DB2 9. Im DB2 Magazine heißt es dazu: "A DWE 9.1.1 refresh available this quarter upgrades the DWE package to DB2 9 and addresses requests from early DWE 9.1 adopters. DB2 9 includes a number of critical enhancements in its role as the underlying engine for DWE, including self-tuning memory management, range partitioning, and row compression."Laut "What's New in DWE 9.1.1" in den Release Notes (Seite 2-4) werden neben der DB2 9-Unterstützung Verbesserungen in folgenden Bereichen ausgeliefert:
Das ist doch nicht normal für ein ein Refresh.
Geschrieben von Axel Holzmüller
in DB2 Data Warehouse Edition
um
13:41
| Kommentare (0)
| Trackbacks (2)
Tags für diesen Artikel: dwe
(Seite 1 von 3, insgesamt 40 Einträge)
» nächste Seite
|
Kalender
SucheKategorienBlog abonnierenVerwaltung des BlogGetaggte Artikel ap127
apl apl grundfunktionen apl+win APL-Zeichensatz apl2 apl2 mainframe apl2 workstation bi computerwoche data mining data studio data warehouse Datenbanken DB2 DB2 Express-C dwe fußball graphpak Homologische Algebra ibm ids inkompatibilität installation Kompression linux Mathematik Microsoft MS Access ms agent MySQL oracle oracle db oss performance sicherheit softwarequaliät sql SQL Server Standards tpc unique vista visual basic windows XML |