Entwicklung - PHP - Keywords dynamisch aus einem Text generieren

PHP: Keywords dynamisch aus einem Text generieren

rob (52)

rob

12.08.2002 00:42

Vinn

  • 323 Postings, noch 27 bis zum nächsten Level (350)

Postings: 323

Keywords dynamisch aus einem Text generieren

Donnerstag, 12. August 2004 16:53

  • 0.0/6 Votes: 0
0.0/6 Votes: 0

um ein besseres Ranking bei Suchmaschinen zu erreichen, hier mal eine PHP-Funktion, welche aus einem Text die Keywords generiert.
die Funktion erwartet als Übergabeparameter den Text, aus dem die Kexwords generiert werden sollen.

Im ersten Schritt werden alle HTML-Tags aus dem Text gefiltert, da diese hier als Keywords nicht gewünscht sind.

$sText = preg_replace('/<.*?>/si', ' ', $sText);
$sText = preg_replace('/lt.*?>/si', ' ', $sText);

im zweiten Schritt werden alle Zeichen (Satzzeichen und Sonderzeichen) in einem Array definiert, welche für die Keywords ebenfalls nicht gebraucht werden können.
Diese Zeichen werden dann in einer Schleife durch ein Leerzeichen ersetzt.

$aBadChars = array("'",'.',':',';',',','?','!','"'
,'=',')','(','&',"\t","\n","\r",'/','}','{','[',']');
foreach($aBadChars as $sChar)
$sText = str_replace($sChar, ' ', $sText);

zur Keyword-Generierung wird nun der Text mit der Funktion explode() anhand des Leerzeichens zerteilt.
Desweiteren wird ein Array mit Wörtern angelegt, die nicht als Keyword gewünscht sind (kann nach Belieben erweitert werden).

$aWords = explode(' ', $sText);
$aNotNeeded = array('können','könnte','wollte','wollen',
'kommt','kommen','dennoch');


in einer Schleife wird nun jedes Wort, welches mehr als 5 Zeichen hat und nicht im Array $aNotNeeded vorhanden ist in ein Array geschrieben.
hier wird zusätzlich noch kontrolliert ob ein Wort nicht schon im Keyword-Array vorhanden ist und ob das Wort kein $-Zeichen enthält (um keine PHP-Variablen aus einem Text auszugeben).
Die Worte werden durch die PHP-Funktion strtolower() in Kleinbuchstaben umgesetzt.


foreach($aWords as $sWord)
{
if(strlen($sWord) <= 5)
continue;
if(!in_array(strtolower($sWord), $aNotNeeded))
{
if(!in_array($sWord, $aKeywords))
{
if(!preg_match('/\$/si', $sWord))
$aKeywords[] = strtolower($sWord);
}
}
}


im letzten Schritt werden noch doppelte Keywords im Array gelöscht und ein String mit den Keywords zurückgegeben,
dazu wird die Arrayelemente mit implode() zu einem String verbunden.

$sKeywords = implode(',', array_unique($aKeywords));
return $sKeywords;

der Aufruf der Funktion könnte dann so aussehen:

$sText = "...hier steht ein langer Textbeitrag";
echo sGetMetaKeywords($sText);

(da würde dann als Keywords rauskommen: "langer,Textbeitrag")

das ganze Script gibt es hier.

Zuletzt editiert:Donnerstag, 12. August 2004 16:59
Bookmark setzen!:Zu Google Bookmark hinzufügen.Zu bloglines hinzufügen.Zu Newsgator hinzufügen.Zu FURL hinzufügen.Zu DIGG hinzufügen.Zu Webnews hinzufügen.Zu Netscape hinzufügen.Zu Yahoo MyWeb hinzufügen.Zu spurl.net hinzufügen.Zu diigo hinzufügen.Zu Newsvine hinzufügen.Zu del.icio.us hinzufügen.Zu SIMPIFY hinzufügen.Zu Mister Wong hinzufügen.Zu Linkarena hinzufügen.Zu isio.de hinzufügen.Zu Oneview hinzufügen.Zu yigg.de hinzufügen.Zu reddit hinzufügen.Zu StumbleUpon hinzufügen.Zu Slashdot hinzufügen.Zu Blinklist hinzufügen.Zu Technorati hinzufügen.Zu Blogmarks hinzufügen.Zu Blinkbits hinzufügen.Zu ma.gnolia hinzufügen.Zu smarking.com hinzufügen.Zu Netvouz hinzufügen.Zu co.mments hinzufügen.Zu Connotea hinzufügen.Zu de.lirio.us hinzufügen.

Specials

Bytefresser Specials: Anno 1404

Umfrage

Welches ist Dein Lieblings-Anno?

(15 Stimmen)

1. Ganz klar: Anno 1800!
2. Anno 2205
3. Anno 2070
4. Anno 1404
5. Anno 1701
6. Anno 1503
7. Anno 1602
8. Anno Online

Benutzer-Counter

Besucher gesamt: 1.159.766
Besucher heute: 20
Besucher gestern: 70
Max. Besucher/Tag: 900
Gerade online: 7
Max. online: 77
Seiten gesamt: 18.081.143
Aufrufe diese Seite: 2.693

Tag-Cloud

  suchmaschinen     ranking     wörtern     php-variablen     schritt     donnerstag     aufruf     zuletzt     funktion     textbeitrag     bytefresser     keywords     zeichen     sonderzeichen     entwicklung     leerzeichen     desweiteren     august     keyword-array     Übergabeparameter     belieben     signatur     html-tags     array     postings     schleife     bookmark     diese     satzzeichen     php-funktion