Spisu treści:
- Kieszonkowe dzieci
- Krok 1: Formatowanie karty SD
- Krok 2: Przygotowanie karty SD
- Krok 3: Podłącz wszystkie części zgodnie z portami
- Krok 4: Wzmocnij to Pi
- Krok 5: Wstępna konfiguracja
- Krok 6: Aktualizacja instalacji
- Krok 7: Przygotowanie plików konfiguracyjnych
- Krok 8: Konfigurowanie słowa-klucza
- Krok 9: Konfiguracja dźwięku (część 1)
- Krok 10: Konfiguracja dźwięku (część 2)
- Krok 11: Testowanie dźwięku
- Krok 12: Łączenie się z chmurą
- Krok 13: Testy końcowe
- Krok 14: Konfiguracja Asystenta Google podczas uruchamiania
- Krok 15: Linia mety
Wideo: Asystent Google na Raspberry Pi w prosty sposób: 15 kroków
2025 Autor: John Day | [email protected]. Ostatnio zmodyfikowany: 2025-01-13 06:58
Asystent Google na Raspberry Pi
Więc jak to wszystko jest możliwe?
Jakiś czas temu Google wypuścił zestaw AI typu „zrób to sam” w numerze 57 magazynu The Magpi. To sprawiło, że stworzenie własnego asystenta Google było niezwykle łatwe, jednak zdobycie zestawu głosowego było nieco trudniejsze i w wielu miejscach wyprzedało się w ciągu kilku godzin. Na szczęście Google udostępniło całe oprogramowanie online wraz z pełnymi instrukcjami. Oznaczało to, że nie potrzebowaliśmy kopii The Magpi, aby skorzystać z całej tej ciężkiej pracy. Mimo to nie ma żadnych wyraźnych instrukcji w Internecie dotyczących korzystania z zestawu głosowego bez kopii magazynu lub bez sprzętu który został dostarczony wraz z nim. Zamiast tego większość samouczków próbuje zainstalować wszystko od zera, co często powoduje bałagan w kodzie, który jest niemożliwy do naśladowania dla wielu osób.
Kieszonkowe dzieci
Co jest wymagane?
Aby pomyślnie ukończyć ten projekt, będziesz potrzebować:
· Raspberry Pi (dowolny model)
· Podstawowy głośnik ze złączem aux 3,5 mm
· Mikrofony USB
· Mysz i klawiatura
Krok 1: Formatowanie karty SD
Pierwszą rzeczą, którą musimy zrobić, to sformatować naszą kartę SD. Użyjmy narzędzia formatowania SD Association, które jest zalecane przez oficjalną fundację Raspberry Pi.
Po zainstalowaniu uruchom aplikację i kliknij „Opcja” Musisz zmienić opcję „REGULACJA ROZMIARU FORMATU” na „WŁ”.
Teraz kliknij „OK” i dwukrotnie sprawdź, czy formatujemy właściwy dysk, a następnie kliknij „Formatuj”. Nie powinno to zająć zbyt dużo czasu, po prostu poczekaj na potwierdzenie, że dysk został pomyślnie sformatowany, zanim przejdziesz do następnego kroku.
Krok 2: Przygotowanie karty SD
Następnie musimy
pobierz obraz karty microSD Voice Kit dla Raspberry Pi. Obraz można pobrać z
Aby przenieść obraz, który właśnie pobraliśmy na naszą kartę SD, użyjemy programu o nazwie Etcher.io. Jest darmowy, open source i nie wymaga instalacji.
Po pobraniu Etchera uruchom program i powinieneś zobaczyć ekran podobny do powyższego. Załadowanie może zająć minutę lub dwie, więc jeśli nie załaduje się od razu, bądź cierpliwy.
Kliknij „Wybierz obraz” i przejdź do pobranego właśnie obrazu zestawu głosowego (aiyprojects-2017-05-03.img). Po wybraniu dwukrotnie sprawdź, czy zapisujesz zawartość na właściwym dysku. Zakładając, że mamy wybrany właściwy dysk, kliknij „Flash!”.
Zapisanie obrazu na karcie SD może zająć około 20 minut lub więcej
Krok 3: Podłącz wszystkie części zgodnie z portami
Podłącz wszystkie potrzebne materiały, takie jak mikrofon, głośniki itp
Zgodnie z pinoutami pokazanymi powyżej
Krok 4: Wzmocnij to Pi
Gdy tylko karta SD będzie gotowa, możemy włożyć kartę microSD do naszego Raspberry Pi. W tym momencie musimy również podłączyć nasz przewód zasilający, kabel HDMI, klawiaturę, mysz, monitor, głośnik i mikrofon USB.
Po podłączeniu kabla zasilającego pozwól, aby Twoje Raspberry Pi uruchomiło się, a wkrótce pojawi się standardowy pulpit Pixel.
Krok 5: Wstępna konfiguracja
Chwyć kursor i przejdź do logo Raspberry Pi w lewym górnym rogu ekranu. Z menu wybierz „Preferencje”, a następnie „Konfiguracja Raspberry Pi”. Następnie przejdź do „Interfejsów” i włącz „SSH”.
Teraz kliknij logo Wi-Fi w prawym górnym rogu ekranu i wybierz swoją sieć Wi-Fi. Jeśli twoje WiFi jest chronione hasłem, zostaniesz poproszony o jego wprowadzenie. Zielony haczyk potwierdza, że nawiązaliśmy połączenie i jesteśmy gotowi, aby przejść do następnego kroku
Krok 6: Aktualizacja instalacji
To jest tak zaawansowane, jak ten samouczek. Idziemy do
użyj terminala deweloperskiego, aby zaktualizować pakiet SDK Asystenta Google, zestaw projektów i zależności, aby upewnić się, że mamy najnowsze wersje. Nie panikuj, jeśli nic z tego nie ma dla Ciebie większego sensu, ale ważne jest, abyśmy nie pominęli tego kroku. Po prostu zrób dokładnie to, co mówi ten samouczek, uważając, aby nie popełnić żadnych literówek, a wszystko będzie dobrze. Więc panikuj, zacznijmy! Kliknij dwukrotnie ikonę na pulpicie „Uruchom terminal deweloperski”. Powinieneś zobaczyć przerażająco wyglądające okno terminala deweloperskiego
Następnie wpisz następujące polecenia w terminalu dokładnie tak, jak wyglądają poniżej. Jest tu 9 poleceń i każde należy wprowadzić osobno w kolejności, w jakiej się pojawiają. Po wpisaniu każdego polecenia naciśnij „Enter” na klawiaturze przed przejściem do następnego. Wykonanie niektórych poleceń zajmie kilka sekund, więc bądź cierpliwy, czekając na zakończenie każdego z nich, zanim przejdziesz do następnego.
cd ~/asystent-sdk-python
Mistrz kasy git
Mistrz pochodzenia git pull
cd ~/rozpoznawanie głosu-raspi
Mistrz kasy git
Mistrz pochodzenia git pull
cd ~/rozpoznawanie głosu-raspi
rm -rf env
skrypty/instalacja-deps.sh
Krok 7: Przygotowanie plików konfiguracyjnych
Następnie musimy wykonać kopię zapasową naszych istniejących plików konfiguracyjnych i przenieść najnowsze wersje, które właśnie zostały zaktualizowane. Oto 4 dodatkowe polecenia, które możesz właśnie to zrobić. Można to zrobić w tym samym terminalu deweloperskim, którego właśnie używaliśmy. Po raz kolejny należy je wykonać w tej kolejności i wpisać dokładnie tak, jak pokazano poniżej:
cp ~/.config/status-led.ini ~/.config/status-led.ini~
cp ~/.config/voice-recognizer.ini ~/.config/voice-recognizer.ini~
cp ~/voice-recognizer-raspi/config/status-led.ini.default ~/.config/status-led.inicp ~/voice-recognizer-raspi/config/voice-recognizer.ini.default ~/.config/ Rozpoznawanie głosu.ini
Krok 8: Konfigurowanie słowa-klucza
Jak dotąd świetna robota! Jesteśmy teraz naprawdę blisko, więc trzymaj się tego.
Musimy teraz zmienić wyzwalacz dla naszego zestawu projektu Google AIY, aby reagował na nasz głos, gdy wypowiadamy słowa „OK Google”. Wpisz następujące polecenie w terminalu deweloperskim:
nano ~/.config/voice-recognizer.ini
Spowoduje to jeszcze bardziej przerażające okno. W tym nowym oknie poszukaj następującego kodu:
# Wybierz wyzwalacz: gpio (domyślnie), clap, ok-google.
# wyzwalacz = klaś
Musimy zmienić ten kod na:
# Wybierz wyzwalacz: gpio (domyślnie), clap, ok-google.
wyzwalacz = ok-google
Jeśli użyjesz klawiszy strzałek na klawiaturze, zauważysz, że pojawia się kursor. Używając klawiszy strzałek, sprowadź kursor do wiersza tekstu, który próbujemy zmienić. Używając klawisza Backspace na klawiaturze usuń wiersz tekstu, który próbujemy zmienić i wpisz go ponownie, tak jak w powyższym przykładzie. Zauważ, że usunąłem również symbol #, ważne jest, abyśmy nie umieszczali # w tym nowym wierszu tekstu. Załączam zrzut ekranu przed i po tym, jak to wszystko powinno wyglądać (okrywając, że cię tam zgubiłem). Zakładając, że twoje okno wygląda dokładnie tak, jak moje, możemy zamknąć i zapisać zmiany. Przytrzymaj „Ctrl” na klawiaturze i naciśnij „X”, aby zamknąć okno. Następnie zostaniemy poproszeni o zapisanie wprowadzonych zmian, naciśnięcie „Y”, a następnie naciśnięcie „Enter” na klawiaturze. Okno zostanie teraz zamknięte, a zmiany zapisane. Aby zmiany weszły w życie, musimy ponownie uruchomić usługę. Wpisz następujące polecenie w oknie terminala i naciśnij „Enter”:
sudo systemctl restart voice-recognizer.service
Krok 9: Konfiguracja dźwięku (część 1)
W tej chwili Asystent Google jest mniej więcej żywy i gotowy do służby. Gratulacje!
Jednak zanim się za bardzo podniecicie, nie będziecie się wzajemnie słyszeć. Dzieje się tak, ponieważ obraz projektu Google AIY został skonfigurowany do pracy ze sprzętem dostarczonym z zestawem. Ponieważ używamy standardowego głośnika aux i mikrofonu USB, musimy poprawić niektóre z konfiguracji. Ponownie użyjemy tego samego okna terminala deweloperskiego, tym razem wpisz:
sudo leafpad /boot/config.txt
Otworzy się okno tekstowe. Przewiń na sam dół dokumentu i usuń # przed wierszem dtparam=audio=on i wstaw # przed dwoma wierszami poniżej. Po wprowadzeniu tych zmian powinno to wyglądać tak:
# Włącz dźwięk (ładuje snd_bcm2835)
dtparam=audio=wł.
#dtoverlay=i2s-mmap
#dtoverlay=googlevoicehat-soundcard
Załączam również zrzut ekranu, aby pokazać, jak to będzie wyglądać. Przejdź do „Plik”, a następnie kliknij „Zapisz. Możesz teraz zamknąć dokument.
Krok 10: Konfiguracja dźwięku (część 2)
Z powrotem w terminalu deweloperskim, wpisz:
sudo leafpad /etc/asound.conf
Po naciśnięciu „Enter” otworzy się nowy dokument tekstowy. Tym razem usuń WSZYSTKI tekst w dokumencie i zastąp go następującym:
szt.! domyślnie {
wpisz asym
przechwytywanie.pcm "mikrofon"
playback.pcm "głośnik"
}
pcm.mikro {
typ wtyczki
niewolnik {
pcm "hw:1, 0"
}
}
pcm.głośnik {
typ wtyczki
niewolnik {
pcm "hw:0, 0"
}
}
Ponownie załączyłem zrzut ekranu pokazujący, jak to będzie wyglądać. Jeszcze raz zapisz i zamknij dokument. Teraz nadszedł czas na ponowne uruchomienie Raspberry Pi. Kliknij logo Raspberry Pi w lewym górnym rogu ekranu i kliknij „Zamknij”, a następnie „Uruchom ponownie”. Po ponownym uruchomieniu Pi mamy jeszcze tylko jedną poprawkę. Ponownie kliknij dwukrotnie ikonę „Uruchom terminal deweloperski” i wpisz następujące polecenie:
leafpad /home/pi/voice-recognizer-raspi/checkpoints/check_audio.py
W tym końcowym dokumencie musisz zlokalizować wiersz kodu, który brzmi:
VOICEHAT_ID = „czapka googlevoice”
Zmień to na: VOICEHAT_ID = „bcm2835”
Po wprowadzeniu tych zmian, tak jak poprzednio, zapisz, a następnie zamknij ten dokument.
Krok 11: Testowanie dźwięku
Na pulpicie znajduje się plik o nazwie „Sprawdź dźwięk”. Kliknij to dwukrotnie i postępuj zgodnie z instrukcjami, aby upewnić się, że zarówno mowa, jak i mikrofon działają.
Jeśli prawidłowo postępowałeś zgodnie z tą instrukcją, nie powinno być żadnych problemów. Jeśli jednak nic nie słyszysz, sprawdź, czy głośność jest zwiększona i czy Twój Raspberry Pi używa „analogowego” do wyjścia dźwięku. Możesz to zrobić, klikając prawym przyciskiem myszy ikonę dźwięku u góry ekranu. „Analogowy” powinien być zaznaczony, tak jak przykład na zrzucie ekranu. Zakładając, że przeszedłeś test audio, możemy przejść do następnego kroku
Krok 12: Łączenie się z chmurą
Zanim Asystent Google udzieli nam odpowiedzi na nurtujące nas pytania, musimy połączyć ją z usługami Google Cloud.
Jest to łatwe, ale jeśli wcześniej nie byłeś w chmurze, na początku może się to wydawać nieco zniechęcające. Oto, co musimy zrobić:
1) Na Raspberry Pi otwórz przeglądarkę internetową Chrome i przejdź do konsoli Cloud:
2) Zaloguj się przy użyciu istniejącego konta Google lub zarejestruj się, jeśli go nie masz.
3) Utwórz nowy projekt i nadaj mu nazwę. Nazwałem swoje „Google Pi”
4) Korzystając z paska wyszukiwania zacznij pisać „Asystent Google” i powinieneś zobaczyć „API Asystenta Google”. Kliknij go, a następnie, gdy załaduje się następna strona, kliknij „Włącz”, aby aktywować API.
5) Przejdź do „Menedżera API”, a następnie „Poświadczenia” i utwórz „klienta OAuth 2.0”.
6) Kliknij „Utwórz dane uwierzytelniające” i wybierz „Identyfikator klienta OAuth”. Jeśli nigdy wcześniej nie byłeś w chmurze, zostaniesz poproszony o skonfigurowanie ekranu zgody. Musisz nazwać swoją aplikację, ja nazwałem swoją „Raspberry Pi”. Wszystkie pozostałe pola można pozostawić puste.
7) Na liście Poświadczenia znajdź nowe poświadczenia i kliknij ikonę pobierania po prawej stronie.
8) Przeglądarka Chrome pobierze teraz mały plik JSON ze wszystkimi Twoimi danymi uwierzytelniającymi przechowywanymi bezpiecznie w środku. Znajdź ten plik i zmień jego nazwę na „assistant.json”, a następnie przenieś go do /home/pi/assistant.json.
9) Na koniec przejdź do strony Kontrola aktywności: https://console.cloud.google.com/ i włącz następujące usługi: Aktywność w Internecie i aplikacjach, Historia lokalizacji, Informacje o urządzeniu, Aktywność głosowa i dźwiękowa.
Pamiętaj, aby zalogować się na to samo konto Google, co wcześniej! Jeśli utknąłeś w dowolnym momencie na tym etapie, nie wariuj, Google wykonało świetną robotę dokumentując ten proces za pomocą zrzutów ekranu dla każdego kroku na stronie Google AIY Kit.
Krok 13: Testy końcowe
Jeśli wszystko zostało poprawnie skonfigurowane w chmurze, jesteśmy teraz gotowi do rozmowy z Google.
Ponownie korzystając z okna poleceń „Uruchom terminal deweloperski”, wpisz następujące polecenie:
src/main.py
To obudzi naszego asystenta, ale ponieważ po raz pierwszy łączymy się z usługami Google, otworzy się przeglądarka internetowa i będziesz musiał zalogować się do Google, aby zezwolić Raspberry Pi na dostęp do interfejsu Google Assistant API. Ponownie upewniając się, że używasz tych samych loginów konta Google, co wcześniej. Po pomyślnym zalogowaniu i przyznaniu uprawnień zostaniesz poproszony o zamknięcie okna. Okno poleceń będzie teraz wyglądać jak dołączony zrzut ekranu potwierdzający, że wszystko zostało poprawnie skonfigurowane. Śmiało, zadaj pytanie, ona słucha! Zanim jednak się za bardzo podekscytujesz, jeszcze nie skończyliśmy. Po zakończeniu gry zamknij okno, w tym celu użyj białego krzyżyka w prawym górnym rogu okna.
Krok 14: Konfiguracja Asystenta Google podczas uruchamiania
Obiecałem, że nasz Asystent Google uruchomi się automatycznie, gdy włączymy Raspberry Pi.
Aby to zrobić, otwórz nowe okno poleceń za pomocą ikony „Uruchom terminal deweloperski” na pulpicie.
Wpisz następujący wiersz kodu w oknie terminala i naciśnij „Enter” na klawiaturze:
sudo systemctl włącz rozpoznawanie głosu
Właśnie skonfigurowaliśmy automatyczne uruchamianie naszego Asystenta Google za pomocą jednej linijki kodu. Jakie to proste!!
Krok 15: Linia mety
Teraz, gdy wykonałeś wszystkie kroki, uruchom ponownie Raspberry Pi. Jeśli dokładnie wykonałeś wszystkie te instrukcje, Asystent Google powinien działać w tle, gdy Pi się ładuje. Spróbuj, powiedz OK Google, aby go obudzić, i zapytaj, co chcesz!