- Kraków: 21 czerwca 2024 (piątek) - Szkolenie AI w SEO i Marketingu
- Warszawa: 5 lipca 2024 (piątek) - Szkolenie AI w SEO i Marketingu
🧠 Zapisz się na szkolenie SensAI - https://www.sensai.academy/
- Ostrzeżenie!!!
- Cel Materiału:
- Domena:
- Wyniki:
- Infrastruktura:
- Omówienie poziomów infrastruktury:
- Backend:
- Poziom 1 - Scrapping
- Poziom 2 - Data warehouse
- Poziom 3 - LLM Infrastructure
- Przykładowe prompty:
- Front-end:
- Poziom 4 - Warstwa prezentacji
- Podsumowanie:
Ostrzeżenie!!!
Cel Materiału:
W materiale tym chciałbym wprowadzić Cię do świata programmatic SEO na przykładzie mojego ostatniego wdrożenia serwisu z modelkami z serwisu Onlyfans.
Pokażę Ci infrastrukturę potrzebna do budowania skutecznych projektów programmatic SEO, miejsca w których możemy wykorzystać modele językowe oraz warstwę prezentacji.
Domena:
Wyniki:
https://www.loom.com/share/87dcaec3146d4a5599b24ca3e21485cd
Infrastruktura:
Skuteczna infrastruktura składa się z 4 poziomów logicznych w podziale na backed (czyli to co się dzieje z tle) oraz front-end (czyli to co pokazujemy użytkownikom oraz wyszukiwarce Google).
Schemat logiki:
Omówienie poziomów infrastruktury:
Backend:
Poziom 1 - Scrapping
Poziom zbierania danych do dalszej obróbki w bazie danych. W przypadku omawianego serwisu było to pobranie treści z domeny Onlyfans.
W przypadku np. ecommerce może to być pobranie opisów produktów ze sklepów konkurencyjnych lub odpowiedników w innym kraju na podstawie numerów SKU/EAN itp..
Może to być zebranie dowolnych innych danych, którymi zostaną zasilone modele językowe.
Do realizacji tego zadania wykorzystałem platformę https://apify.com
Omówienie:
https://www.loom.com/share/5f1d4bbcb9df4f56abeb9bec85837b14
Poziom 2 - Data warehouse
Baza danych w której będą przechowywane dane, na których zostaną wykonywane operacje logiczne z wykorzystaniem AI.
Omówienie:
https://www.loom.com/share/8f93c6bfe6744ce79e561d5ca2f9b38a
Poziom 3 - LLM Infrastructure
Poziom w którym nasze oprogramowanie na podstawie danych z bazy danych realizuje przetwarzanie danych, rozszerzenie ich, klasyfikację z wykorzystaniem modelu językowych.
Wykorzystana infrastruktura alternatywna: https://www.anyscale.com/
Wykorzystane modele językowe:
mistralai/Mistral-7B-Instruct-v0.1 mistralai/Mixtral-8x7B-Instruct-v0.1 mistralai/Mixtral-8x22B-Instruct-v0.1
Wykonane operacje:
- klasyfikacja płci - na podstawie opisów, imion, nickname
- ekstrakcja słów kluczowych (parametrów) opisujących modelkę na podstawie zebranych danych
- generowanie podsumowań na temat modelki - TL;DR
- generowanie długich opisów odpowiadających na najczęściej zadawane pytania
- ekstrakcja lokalizacji - miasta i kraju (na podstawie miasta)
- generowanie opisów kategorii/listingów
Powyższe operacje pozwoliły mi na rozbudowanie bazy danych tak, że jest możliwe wyszukiwanie i nawigacja po niej a tym samym zbudowanie nawigacji serwisu.
Najistotniejsze jest to, że wszystkie operacje AI zostały wykonane na bazie faktycznych danych o modelkach przez co udało uniknąć się problemu halucynacji. Operacja miały też charakter klasyfikacyjny - to bardzo ważne.
Jak możesz to wykorzystać np. w swoim ecommerce:
- klasyfikacja produktów
- ekstrakcja cech produktów np. wielkość, kolor itp.
- dopasowania produktów do kategorii np. karma dla bernardyna, karma dla jamnika, karma dla owczarka…
- ekstrakcja parametrów produktów na podstawie których zostanie zbudowana nawigacja w sklepie
- zebranie i rozszerzenie opisów produktów na podstawie zebranych opisów po numerach EAN/SKU
- generowanie podsumowań produktów - najważniejsze cechy
- generowanie odpowiedzi na najważniejsze pytania o produkcie - na podstawie danych
- klasyfikacja produktów powiązanych/podobnych
- …
Przykładowe prompty:
- Sumaryzacja opisu
[INST]
# Summarize informations about models
# Remove all url, domains
# Output: list with short description and parameters\n
# No extra words and characters in output\n
[/INST]
- Generowanie opisu modelki
[INST]Answer following questions
Rules:
# Headings and answers with big letter
# Use as many keywords in answers as possible
# Use Name and Username in answers
# Use as many facts and details as possible
# Use simple, short sentences that are easy to understand by natural language processing and human
# Use semantically related keywords and phrases to the main topic
# Maintain high levels of perplexity and burstiness without losing specificity or context.
# Make sure that your writing is based on impartial and neutral facts.
# Avoid irrelevant words and sentences. Use words that carry the intended meaning based on the specific context.
# Use numerical values instead imprecise terms like “many” or “a lot” to enhance clarity.
# Use appropriate verbs that are relevant to the specific context.
# Use plural nouns in examples to demonstrate a broader range of possibilities.
# Output in English
Questions and format:
<h2>What does {Username} do on OnlyFans?</h2>
<h2>Does {Username} post nude content on OnlyFans?</h2>
<h2>Does {Username} upload leaks to her OnlyFans?</h2>
<h2>How Much Does {Username} OnlyFans Cost?</h2>
<h2>Does {Username} have sex on onlyfans?</h2>
<h2>Does {Username} do porn on onlyfans?</h2>
<h2>Where is {Username} from?</h2>
##Output Requirements:
As an output provide only content without any additional comments. Provide clean html.
[/INST]
- Ekstrakcja słów kluczowych
[INST]
Extract keywords related to adult content.
## Rules:
1. Exclude any copyright, legal notes, and disclaimers.
2. Eliminate any keywords not associated with adult content.
3. Remove any duplicate keywords.
4. No extra words in output
5. Output list in a comma-separated format.
6. Output is in English.
[/INST]
Zachęcam tutaj do testów, twórczości i kreatywnego wykorzystania modeli językowych na podstawie posiadanych przez Ciebie danych.
Front-end:
Poziom 4 - Warstwa prezentacji
Na tym poziomie prezentujemy naszą stronę internetową zbudowaną na podstawie operacji z poziomów 1,2,3.
Nie wykonujemy tutaj żadnych operacji logicznych oraz nie wykorzystujemy AI.
Wykorzystana technologia w przypadku mojego wdrożenia to:
- Wordpress - darmowy CMS
- WP all import - https://www.wpallimport.com/ - wtyczka dzięki której zrealizowałem komunikację między bazą danych a wordpress
- Elasticpress - https://www.elasticpress.io/ - wtyczka dzięki której zrealizowałem system wyszukiwania i nawigację w serwisie
- Advanced Custom Fields - https://www.advancedcustomfields.com/ - wtyczka dzięki której dodałem dodatkowe pola do wordpress co umożliwoło mi wgranie danych
Omówienie:
https://www.loom.com/share/2ccdc09788ff4c57bfc5b0a443bb50e8?sid=b500b8bc-e04e-457d-bf6a-57899fe574ff
https://www.loom.com/share/72a8948fb3e7421589123e80de4e0a26
Podsumowanie:
https://www.loom.com/share/2a1cd013a4ee44fa8f2ccc6807a49615