ciąg dalszy SXHTML

Odpowiem Wojtkowi:

domyślam się, że żeby Twój pomysł zaczął działać, trzeba by wprowadzić zmiany w INTERNETOWYCH PRZEGLĄDARKACH? Czyli wszystko w rękach producentów Iexplorera i Firefoxa?

Otóż - nie. Informacja w atrybucie REL nie jest dla przeglądarek, lecz dla agregatorów, wyszukiwarek, serwisów www itd. Przeglądarka stronę z SXHTML wyświetli identycznie jak stronę bez SXHTML. Informacje w atrybucie REL jest dla maszyny.

Pomysł jest taki, aby była to informacja prosta w stworzeniu dla człowieka (nawet nietechnicznego) i zrozumiała dla maszyny ORAZ żeby niosła wiedzę na temat znaczenia dokumentów.

SXHTML można rozumieć jako uproszczony RDF, tzn. zdania w RDF to "trójki" (triples) obiekt1 orzeczenie obiekt2, np.

Pawel knows Paulina

lub też

dc:creator

W SXHTML wiele trójek/tripletów dotyczących może być zapisanych w jednym atrybucie REL. Atrybut zawiera same relacje, a obiekt1 to strona z kodem, obiekt2: strona docelowa, np. na taraka.pl można umieścić kod

[code type="html"]

[/code]
Chciałbym jednak unikać tych RDFowych/XMLowych przestrzeni nazw ("dc:owner"), żeby to było proste.

Wolałbym to zapisać tak:

<a href="http://taraka.pl/_odwydawcy.htm" rel="wydawca twórca autor">
<a href="http://www.taraka.pl/autor.php?id=stawiszy%F1ski" rel="autor znajomy">

W bardzo uproszczonej postaci można traktować SXHTML jako tworzenie odnośnika ze słowami kluczowymi. To już trochę jest robione, ale jest nieudolnie, dlatego np. Google próbuje jako słowo kluczowe brać słowo wewnątrz znacznika A. Co jest błędem, bo zawartość znacznika nie ma być określeniem obiektu docelowego. To, że tak się robi, to tylko dlatego, że taki jest dyktat Google. Ale już zwykłe linkowanie przez obrazek psuje tę technikę. W dodatku takie opisywanie linków jest ograniczone do jednego słowa.

Odnośnik z atrybutem REL ma tę wartość, że odwołując się do innego dokumentu, określa ten docelowy dokument przez słowa kluczowe, a ma to większą wartość w sensie jakości wiedzy, niż jak sam dokument określi się słowami kluczowymi.

Podobną technikę stosuje się dzisiaj powszechnie, wypisując słowa kluczowe obok odnośnika, np. tak jak na wykopie.

Ten sposób jest jednak nieczytelny dla maszyny (tzn. jest czytelny dla automatu napisanego pod wykop, ale nie jest czytelny uniwersalnie).

Można chwilowo pozostawić rozważania na temat relacji i jakiejś zaawansowanej semantyki. Wystarczy wprowadzić pomysł, by tagować odnośniki, co od razu i w prosty sposób podniesie wiedzę, jako zawierają dokumenty w sieci, wiedzę, która może być efektywnie przetwarzana przez maszynę.

Wydaje mi się, że sensowne jest też wprowadzenie opcjonalnego wartościowania słów kluczowych, tzn.

<a href="http://taraka.pl" rel="szamanizm(5),sztuki rytualne(10),tarot(5),astrologia(10),słowianie(3)">

lub nawet prawdopodobieństwa relacji (co jest podobne do wartościowania, ale nie tożsame)

<a href="http://netto.blox.pl" rel="web 2.0[50%],blip[50%]">

Acha, w tym proponowanym zapisie słowa kluczowe są oddzielane przecinkami lub spacjami. Jeśli atrybut zawiera przynajmniej 1 przecinek, to znaczy, że separatorem jest przecinek. W przeciwnym razie separatorem jest spacja.

Zagadnienie się rozszerza, może wyodrębnię oddzielny kanał na zapisywanie informacji o SXHTML.