Der "mittelpunktbasierte" Clusteralgorithmus mit einer
Kohonen-Karte lässt sich durch verschiedene Parameter beeinflussen. In den Mining-Einstellungen des Clusterer-Operators wird nach
Auswahl von "Kohonen" als Algorithmus "Anzahl Durchgänge" angeboten. Die maximale Anzahl Cluster ist als Vorgabe für beide Segementierungsverfahren vorgesehen.
Bleiben noch die beiden Größen für die Bestimmung des "Zuordnungslayout": LayoutNumRows und LayoutNumColumns. Hierfür bietet der Clusterer-Operator keine eigenen Eingabefelder an. Es bleibt also nur die Spezifikation der Layoutwerte mittels "Optionale Parameter".
Und das ist nicht trivial, da sollte man schon mal die Online-Hilfe zu Rate ziehen. Die rät einem mehr oder weniger verklausoliert zu
DM_setAlgorithm('Kohonen','<LayoutNumRows>4</LayoutNumRows><LayoutNumColumns>5</LayoutNumColumns>').
Zumindest habe ich keine bessere Variante gefunden.
Der Code-Generator macht daraus folgenden Prozeduraufruf:
CALL IDMMX.BuildClusModel('Mining.CLUSTER_04', 'INPUT_04', 'DM_setAlgorithm(''Kohonen''), DM_setAlgorithm(''Kohonen'',''<LayoutNumRows>4</LayoutNumRows><LayoutNumColumns>5</LayoutNumColumns>'')');
Es wird also zweimal der Algorithmus gesetzt. Das stört den DWE Miner wenig, denn der letzte DM_setAlgorthm sticht.
Es geht also auch
CALL IDMMX.BuildClusModel('Mining.CLUSTER_04', 'INPUT_04', 'DM_setAlgorithm(''Demographic''), DM_setAlgorithm(''Kohonen'',''<LayoutNumRows>4</LayoutNumRows><LayoutNumColumns>5</LayoutNumColumns>'')');
Diesen Statement entsteht durch die Eingabe obiger "Optionaler Parameter" und Auswahl von "Demographisch" unter "Algorithmus". Tatsächlich wird hier letztendlich der Kohonen-Algorithmus ausgeführt.
Doch zurück zum Layout der Kohonen-Karte. Durch die Eingabe der obigen Werte für Anzahl Zeilen und Spalten werden vom Miner 20 Cluster erstellt. Es empfiehlt sich keinen Wert ungleich 0 unter "Maximale Anzahl Cluster" einzugeben. Andernfalls gibt's was auf die Finger:
"IDM4503E: Der Mining-Lauf kann auf Grund von Problemen mit den Einstellungen nicht ausgeführt werden. In den Einstellungen werden die maximale Clusteranzahl und das Layout der Kohonen-Karte angegeben. Entfernen Sie die Angabe der maximalen Clusteranzahl oder die Angabe des Layouts der Kohonen-Karte, und wiederholen Sie den Versuch."
Bleibt noch die Frage, was "Kohonen" macht, wenn das Layout wie oben spezifiziert wird und im Feld "Anzahl Durchgänge" irgendetwas anderes als "10" steht. Kurz bemerkt: Dieser Wert hat keine Wirkung mehr, denn der letzte DM_setAlorithm gewinnt und hier werden keine besonderen Angaben für die Anzahl Iterationen gemacht.
Im Falle, dass man das Standard-Layout verändern möchte und gleichzeitig den Algorithmus zu mehr oder weniger als 10 Iterationen zwingen will, sollte man in DM_setAlgorithm noch das Element ''<NumPasses>20</NumPasses>'' (z.B.) einfügen.
Doch in den meisten Anwendungsfällen wird das wohl nicht nötig sein. Denn die Default-Karte hat 3 Zeilen und 3 Spalten, also im Ergebnis 9 Cluster. Das sollte in den meisten Fällen für den Anfang passen.