Spraakassistentie zonder cloud dankzij zelfbouw - Conclusie

Conclusie

Het is mogelijk om zelf een functionele spraakassistent te bouwen. Bij elkaar opgeteld is de hardware die je daarvoor moet aanschaffen, vaak wel een stuk duurder dan de spraakassistenten die je kant-en-klaar in de winkel aanschaft. Daarvoor koop je een hoop privacy terug, want zodra je een commerciële spraakassistent in je huis plaatst, deel je ook de status van alle gekoppelde apparaten constant met een externe partij. In ruil voor privacy verlies je wel functionaliteit, want hoe je ook je best doet, een lokaal platform beschikt niet over allerlei actuele weetjes en feiten, dus daar hoef je een lokale spraakassistent niet naar te vragen. Op dit moment ben je beperkt tot apparaatbediening en statusupdates.

Platforms

Hoewel de twee platforms die we in dit artikel hebben bekeken, onderliggend veel van dezelfde componenten gebruiken, verschillen ze nogal in functionaliteit en installatiegemak. Home Assistant timmert hard aan de weg met spraakassistentie en het jaar waarin er extra aandacht wordt besteed aan de ontwikkeling, is nog niet voorbij. De ontwikkeling van Rhasspy staat evenmin stil. Sterker nog, er zit meer vaart in dan voorheen het geval was. Doordat de ontwikkelaar kan sleutelen aan componenten die gebruikt worden in zowel Home Assistant als Rhasspy, profiteren beide pakketten van nieuwe mogelijkheden en optimalisaties, en werken ze ook steeds beter samen.

Als je op dit moment zelf een spraakassistent gaat bouwen, is de software met name afhankelijk van je platformkeuze. Gebruik je Home Assistant, dan heeft het in de meeste gevallen weinig zin om daar nog Rhasspy bovenop te installeren. Met de introductie van wakewords in Home Assistant doet de spraakassistent in functionaliteit weinig meer onder voor Rhasspy. De spraakherkenning van het platform is nog wel matig als je de Nederlandse taal gebruikt. Een woord als 'zet' wordt vaak herkend als 'set', al laat de intentieherkenning zich hier gelukkig niet zo makkelijk door van de wijs brengen. Lastige zelfverzonnen apparaatnamen zijn een groter probleem. Die werden bij mij vaak slecht herkend, ongeacht de complexiteit van het onderliggende spraak-naar-tekstmodel. Het ondersteunde aantal spraakcommando’s is ook nog beperkt, maar je kunt handmatig extra zinnen toevoegen. Op dit moment moet je een zin dan wel exact zo uitspreken als hij is ingesteld.

Rhasspy is relatief makkelijk te installeren, maar de configuratie vereist dat je de handen uit de mouwen steekt, goed nadenkt en de documentatie leest. Dat maakt het pakket veelzijdig, maar ook dat een goede Rhasspy-set-up niet op één zondagmiddag gebouwd is. Daarna zal je smarthomeset-up telkens onderhoud nodig hebben als je hem verandert en uitbreidt. Als je het pakket met Home Assistant gebruikt, is dat onderhoud iets minder intensief, doordat het pakket nieuwe apparaatnamen zelf kan ophalen en enkel opnieuw getraind hoeft te worden. Voor de combinatie met andere platforms zul je zelf een gestroomlijnde oplossing moeten vinden om nieuwe apparaatnamen te trainen. De intentieherkenning kan uitgebreid werken, maar je moet de syntax aanleren om dat te doen. Door de vrije en uitgebreide keuze van pakketten voor elke laag is het pakket heel slank of heel zwaar uit te voeren. In combinatie met satellieten kun je vrij kiezen welke taak op welk apparaat wordt uitgevoerd. Kortom, een bewerkelijk pakket met mogelijkheden waarvoor je even moet gaan zitten, maar het is de multitool onder de spraakplatforms.

Hardware

Goed verkrijgbare kant-en-klare hardware laat ook nog even op zich wachten. Espressifs ESP32-S3 Box-3 komt wat specificaties betreft in de buurt van de ideale assistent, maar moet zichzelf nog in de praktijk bewijzen. Het apparaat is op het moment van schrijven overal uitverkocht, maar nieuwe voorraad is aangekondigd. Het beste alternatief is op dit moment om zelf iets te bouwen, want de M5Stack ATOM Echo is een leuke gadget om mee te spelen, maar niet geschikt voor grotere ruimtes. Als je handig bent met elektronica en een 3d-printer, kun je wel al tot enorm gave resultaten komen.

Met een singleboardcomputer heb je al een stevige basis die zelf ook wat taken kan afhandelen, maar daarvoor moet je een goede microfoonarray en speaker vinden. Een conferentiemicrofoon is ideaal voor het doel. Dat hele pakket inclusief Raspberry Pi zul je echter een plekje uit het zicht moeten geven, want naast de ruimte die het in beslag neemt, zijn conferentiemicrofoons vormgegeven voor een strak kantoor en minder fraai in je interieur.

Toekomstvast knutselproject

De werking van een lokale spraakassistent is nog lang niet te vergelijken met de functionaliteit van de commercieel verkrijgbare varianten. Natuurlijk heeft dat deels te maken met de kracht van de achterliggende cloudservice van die producten. Uitzonderingen daargelaten zijn er weinig tweakers die een thuisserver hebben met de kracht om de large-languagemodels te kunnen faciliteren die die uitgebreide functionaliteit mogelijk maken. Wie cloudloos wil leven, moet in dit geval dus nog even wat pijn lijden en voornamelijk flink wat tijd investeren in de fijnafstelling van zijn installatie.

Als je daaraan begint, is de kans groot dat je eindigt met meer functionaliteit dan mogelijk was op het moment dat je startte, want de ontwikkelingen gaan razendsnel. Zeg nou zelf, er is weinig mooier dan dit soort projecten voor je neus beter te zien worden en daar deel van uit te maken. Heb je dus nog een Raspberry Pi en microfoon liggen, dan is beginnen met bouwen van een satelliet een leuke klus, hoewel daar de nodige tijd in gaat zitten. Het is wellicht (en hopelijk) het begin van een zelfbouwproject dat op termijn alle commerciële, datahongerige spraakassistenten uit huis verdrijft.

Reacties (79)

GewoonWatSpulle
16 oktober 2023 06:54

Praten tegen een apparaat blijft ik toch maar vreemd vinden. Een smart home moet voor mij automatisch werken of ik vind het weinig smart.

"Hey Google zet eettafel op 70%" hoe moet iemand die op onze katten past dat allemaal weten? Zet je gewoon de lampen aan 1 uur voor schemering met een extra offset voor verwachte bewolking?

MrMonkE
@GewoonWatSpulle • 16 oktober 2023 07:24

Ik vindt het praten niet vreemd. Het zich voordoen als 'mens' wel. Doe gewoon wat ik zeg.
Geen formaliteiten. Geen herhaling van wat ik zei. Niets van dat alles.

3 + 3 = ZES
Niet; Je wilt de som van 3+3 weten. De som van 3+3 heeft als antwoord 6.
AI verspilt 30% van mijn tijd met herhalen van mijn vraag en te lang antwoord.
</rant>

AI doet zwaar aan Humansplaining.

Of AI die sorry zeggen... dan ga ik spontaan over mijn nek.

[Reactie gewijzigd door MrMonkE op 16 oktober 2023 07:25]

phray
@MrMonkE • 16 oktober 2023 08:11

Het herhalen van de vraag bevestigend of de assistent je goed heeft begrepen. Als jij zegt wat is 3 + 3 maar het verstaat 3 + 4 dus zegt alleen 7 als antwoord en jij weet niet beter dan krijg je dus foute informatie zonder het door te hebben.

MrMonkE
@phray • 16 oktober 2023 08:14

Point taken!
Maar daar kan ik mee leven. Ik erger me echt kapot aan al die overhead.
Maak maar optioneel dan.

drdelta
@MrMonkE • 16 oktober 2023 13:02

Compleet met je eens.

Ik heb zowel een Google Home Mini en een Amazon Echo Dot, en bij de Dot kun je gewoon "verbose" kiezen.

Die Dot doet dan gewoon wat je zegt, en valt je niet lastig met allerlei onzin.

Ja ik weet ik zei, dat hoef ik een computer stem niet nog een keer anders verwoord te horen herhalen.
Desalniettemin blijft die Google Home Mini mij tergen met woorden die ik niet hoef en wil horen.

djwice
@MrMonkE • 16 oktober 2023 08:33

Doet mijn denken aan de Perrot car kit.
Wie wilt u bellen?
Ik zeg de naam.

Car kit herhaalt de naam en zegt "oproep bezig".

Ik had dat ie soms iemand anders wilde bellen, dan is die herhaling fijn. Snel escape knop drukken.

En ik spreek anders tegen de card kit dan tegen een mens, meer pauses tussen de woorden en een duidelijker nadruk op het begin van een woord.en zo min mogelijk intonatie (stem monotoon laten klinken).
Dat geeft bij mij het beste resultaat.

Andros
@djwice • 16 oktober 2023 08:39

En dat doe je alleen maar omdat de techniek nog niet ver genoeg is om er op een normale manier tegen te spreken. Je past je aan aan de technische beperkingen terwijl techniek juist bedoelt is om het de mens makkelijker te maken. Er gaat een tijd komen dat je gewoon zegt "zeg auto, bel even naar Kees" en dat de auto zelf al zegt "sorry, was het nou Kees of Mees?" als het ding je niet goed verstaat. Verstond die je wel goed dan belt het ding gewoon Kees. Net als dat je nu iemand een vraag of bevel geeft en die enkel bevestiging vraagt als die persoon niet zeker is. Maar zover zijn we technisch blijkbaar nog niet

djwice
@Andros • 16 oktober 2023 08:46

De Perrot is al een jaar of 13.en werkt nog steeds goed met alle telefoons. Vroeger met de Nokia (bar telefoon met toetsen, niet smart), tegenwoordig met de nieuwste smartphones nog steeds.

Toch gaaf dat zo'n "oude" standaard voor het opvragen van contactgegevens aan je telefoon via bluetooth gewoon nog steeds werkt!

Toch echt een knap staaltje werk van die Nederlandse uitvinder. .geek: Nederlandse bluetooth-uitvinder wordt opgenomen in Hall of Fame
Het zorgt voor veel gemak. Wat mij betreft verdient ie een koninklijke onderscheiding.

[Reactie gewijzigd door djwice op 16 oktober 2023 08:47]

SpazzII
@Andros • 16 oktober 2023 10:11

Dat vraag ik me af. Met de toon die je gebruikt markeer je wat je zegt, je geeft het context. Die context kan belangrijk zijn voor degene of hetgeen waar je tegen praat, maar misschien ook voor degene waar je juist niet tegen praat. Als ik ineens “licht aan” door de kamer roep verwacht ik niet dat mijn vrouw van de bank opspringt om het licht aan te doen. Ik heb het natuurlijk niet tegen haar, ondanks dat zij de enige andere persoon in de kamer is, en dat moet blijken uit de toon en de woordkeuze. Een “ik praat tegen een apparaat”-stemmetje heeft dus meer functie dan rekening houden met technische beperkingen. Overigens zijn er talloze contexten die we met ander toon en taalgebruik markeren. Tegen kinderen praten is misschien een mooi voorbeeld, maar de presentatie van de laatste kwartaalcijfers zal anders klinken dan de verkooppraat van een nieuw innovatief product.

copi
@MrMonkE • 18 oktober 2023 11:53

Bovendien gok ik dat de speech-to-text engine wel een nauwkeurigheid meegeeft (moet wel, anders kan hij nooit zeggen: bedoelde je bla-bla-bla). In dat geval is de herhaling nuttig, in andere gevallen kan het idd lekker wegblijven.

[Roland]
@MrMonkE • 16 oktober 2023 08:17

Die herhaling vind ik ook irritant maar is wel nodig. Je wilt wel zeker weten dat de vraag goed verstaan is.

Niet bij lampen aanzetten, houd je mond (dat is gelukkig bij Google ook veranderd een paar jaar geleden) maar bij wat is 3+3 eigenlijk wel. Antwoord zal maar 7 zijn omdat de vraag niet goed verstaan was, jij doet de dus 7 shotjes rum door je cola en je bent al dronken voor het feestje begonnen is.

Zolang verstaanbaarheid nog een ding is wel handig dat je vraag gecheckt wordt.

Verder echt eens. Ik hoef je niet horen, doe gewoon wat ik je beveel.

djwice
@[Roland] • 16 oktober 2023 08:34

Ik denk dat je met 7 shotjes rum in je cola wellicht minder goed verstaanbaar wordt

MrMonkE
@djwice • 16 oktober 2023 08:59

Ik acht het onwaarschijnlijk dat die assistent dan de morgen haalt.

djwice
@MrMonkE • 16 oktober 2023 09:22

Die assistenten hebben inderdaad vaak geen IP67 of IP68 rating. En ik vermoed dat de coating en opdruk ook liever alcoholvrije en koolzuurloze drank heeft

[Reactie gewijzigd door djwice op 16 oktober 2023 09:28]

Wouterie
@MrMonkE • 16 oktober 2023 11:06

Ooit met een portofoon gewerkt? Het zou een hoop ellende schelen als mensen ook de vraag zouden herhalen voordat ze het antwoord gillen.

dooiedodo
@GewoonWatSpulle • 16 oktober 2023 08:02

Ik wil het eigenlijk anders. Als ik merk dat ik iets nodig heb van een assistent, moet de assistent het eigenlijk al weten en mij vragen of ik lichten aan wil of wat dan ook. Dan hoef ik alleen maar ja of nee te zeggen of een keuze te maken
Lijkt me heerlijk, een echte James die vooruit denkt

LikeABawzs
@dooiedodo • 16 oktober 2023 11:16

Dit is dus ook precies wat ik wil.

Ik wil thuis komen, zodra je de woonkamer inloopt, het systeem vraagt:
Wil je dat ik de PC/TV aanzet?
Ja/Nee. En hopla.

Had gehoopt dat HA hier toch wel iets mee zou moeten kunnen. Moet toch prima te doen zijn.
Aangezien het ook al mogelijk is via telegram om iets te doen met een input knop.

Kjoe_Ljan
@LikeABawzs • 16 oktober 2023 16:18

Kan een assist pipeline opgestart worden vanuit HA, en dat de assist de eerste actie onderneemt? Of werkt assist alleen als reactie op (al dan niet gesproken) tekst?

In mijn hoofd zou dit zo simpel moeten zijn als

- Sensor ziet dat je een kamer binnenloopt en triggert een automation (misschien op basis van een boolean die bijhoudt of een apparaat aan staat/of het de eerste keer is vandaag/...)
- Automation trapt de Assist Pipeline af en luistert naar een antwoord.

i-chat
@LikeABawzs • 16 oktober 2023 16:45

zoiets kan toch ook prima.

Dit is dus ook precies wat ik wil.

Ik wil thuis komen, zodra je de woonkamer inloopt, het systeem vraagt:
Wil je dat ik de PC/TV aanzet?
Ja/Nee. En hopla.

Had gehoopt dat HA hier toch wel iets mee zou moeten kunnen. Moet toch prima te doen zijn.
Aangezien het ook al mogelijk is via telegram om iets te doen met een input knop.

had gehoopt dat..... klinkt meer als, ik heb geen zin om de tijd en moeite te steken om dit werkend te krijgen, het kan namelijk prima.

wat al bestaat:
detectie van personen,
herkenning van personen,
berichten en/of vragen sturen via google, (via google smart API)
het antwoord afwachten van google (via google smarte API)
een actie uitvoeren aan de hand van google smarthome API.

met iets als nodeRED moet je al prima een presense detectie kunnen doen, en vermoedelijk ook al wel kunnen detecteren WIE er de kamer binnenkomt. maar of je dat nu kunt of niet Hoi Likabaws of gewoon Hallooooo! maakt eigenlijk al weinig uit.

de volgende stap is op in de asistant een nieuwe custom intent te bouwen die dus een vraag kan stellen een antwoord kan verwerven https://clearbridgemobile...-app-handling-user-input/ lijkt (snelle google search) daar een redelijk beginpunt.

als laaste geef je die var terug aan nodered en kun je daar de rest van je routine op baseren.

maar ik denk dat je zoiets met raspi ook prima zult kunnen doen!

[Reactie gewijzigd door i-chat op 16 oktober 2023 16:46]

MrMonkE
@dooiedodo • 16 oktober 2023 08:25

10:00:01 "jAImes, zet koff.." BEEEP BEEEPBEEEPBEEEPBEEEPBEEEP
10:00:02 Versie koffie staat reeds klaar.

i-chat
@MrMonkE • 16 oktober 2023 11:29

ik vraag me oprecht af of ik wel zou willen leven met de mate van privacy-invasion die nodig is om zo goed op mijn leven in te spelen.

computer: Ola la la - de scharrel die je vannacht hebt opgepikt heet x ik heb via google cloud contact gezocht met haar persoonlijke AI deze geeft aan dat ze altijd y en z eet als ontbijt wil je dat ik voor haar een ontbijtje bestel bij: ubereats?

FerryB69
@i-chat • 16 oktober 2023 21:54

Kan soms wel handig zijn: de scharrel die je vannacht hebt opgepikt heeft eergisteren een medicijn tegen chlamidia besteld, wilt u dat ik hetzelfde medicijn voor u bestel?

PhRiXoS
@GewoonWatSpulle • 16 oktober 2023 09:51

hoe oud ben je ?
Het is namelijk maar net in welk "normaal" je bent opgegroeid. Mijn kinderen (12 en 15) weten niet anders dat de verlichting automatisch gaat en dat je eventueel dingen kunt regelen met je stem. Zij sturen ook spraakberichtjes via whatsapp ipv teksten. Dit is hun "normaal"
Zelf vind ik het moeilijker om hier aan te wennen, al spreek ik wel tegen een apparaat inmiddels.
Des te ouder je wordt, des te moeilijker je je kan aanpassen aan de "normaal" waarin je bent opgegroeid.

lenwar

@PhRiXoS • 16 oktober 2023 13:22

Ik zie niet hoe leeftijd hierin relevant is?
Jouw kinderen zijn gewend dat lampen automatisch aan- en uitgaan, omdat je dat ter beschikking hebt gesteld, dan wel opgedrongen hebt aan je kinderen (even gechargeerd verwoord natuurlijk). Veel van hun klasgenootjes zullen dat niet hebben.
Voor jouw kinderen is het dan mogelijk 'normaal', maar dat staat los van de leeftijd. Dat is eerder het huishouden.

Die spraakberichtjes via WA ipv tekstberichten zie ik persoonlijk niet veel gebeuren in mijn omgeving en ook niet met kinderen. Ik zie wel dat kinderen die vaker doen dan volwassenen. Dat wel, maar ik zou het zeker niet als 'het normaal van kinderen' beschouwen.

Voor mij persoonlijk:
De lampen in de gang/overloop/voorzolder gaan inderdaad automatisch. De rest van het huis heeft draadloze wandschakelaars. De bewegingssensoren in de andere 'leef-kamers' van het huis zorgen alleen voor een pushbericht dat het licht nog aan staat (of tv nog aan staat, enz, enz, enz) en er al een tijdje niemand in de kamer aanwezig is. (en je kan dan via het pushbericht in één keer het licht aan laten of uitzetten (Actionable Notifications op iOS. Android heeft vast ook zoiets)). Dit systeem werkt uiteraard niet feilloos, want die bewegingssensoren detecteren je niet als je echt heel stil zit een tijdje lang). Aldoende het push-bericht ipv de lichten automatisch uitzetten

PhRiXoS
@lenwar • 16 oktober 2023 13:27

punt is dat je het altijd bekijkt van wat je zelf "normaal" vindt.
van 0 tot 20j is jouw normaal
van 20-35j je kan je aanpassen aan wijzigingen aan jouw normaal
boven 35j alles wat afwijkt van jouw normaal begrijp je niet.

de leeftijden hierboven kunnen natuurlijk per persoon afwijken, maar mijn punt gaat dus dat je altijd redeneert vanaf je eigen normaal.

boolean
@GewoonWatSpulle • 16 oktober 2023 21:54

Hetgeen jij onder "smart" verstaat is een koud kunstje dat ik vijftien jaar geleden als student in mijn anti-kraak apartment al volledig met domotica had ingericht. Dan kom je er overigens al snel achter dat slechts een handjevol smart-functies daadwerkelijk praktisch zijn, en de rest gewoon neerkomt op spielerei. Ik heb zowel met HA als Homey geëxperimenteerd, maar op een gegeven moment ben je er klaar mee en wil je gewoon een systeem dat 24/7 operationeel is en zichzelf voortdurend verbetert zonder dat je er naar om hoeft te kijken.

Sterker nog, het automatiseren van lichten, rolluiken, vijverpompen, etc. kon dertig jaar geleden ook al; dat is niets nieuws. De komst van software heeft het slechts eenvoudiger/praktischer gemaakt. Hetgeen een smart home écht definieert is de spaakimplementatie, iets wat heel lang toekomstmuziek is geweest.

Ik ben inmiddels volledig over gestapt op Google Home/Assistant. Het is super eenvoudig te configureren en het doet wat het moet doen. Als mijn dochter van zes gaat slapen, zegt ze: "Hey Google. Welterusten!". Vervolgens vraagt Google of en hoe laat er een wekker moet worden gezet, dimmen de lichten langzaam tot ze volledig uit zijn, gaat het rolluik dicht, de airco met luchtreiniger op de nachtstand en worden er er rustgevende natuurgeluiden afgespeeld, zonder dat ze hiervoor uit haar hoogslaper hoeft te komen. 's Ochtends gaat een kwartier voor haar wekker afloopt (het tijdstip is afhankelijk van de door haarzelf ingestelde tijd) het rolluik 25% open en de lichten (10min later) op 20%.

Als spraakbesturing niet mogelijk was, had ik niet eens de moeite genomen om dit alles te automatiseren. Een buitenlampje kun je prima automatisch bij zonsondergang aan laten gaan (en bij zonsopgang weer uit), maar je wilt niet dat je domotica systeem bepaalt wanneer jij naar bed gaat of ontwaakt.

Als ik 's nachts uit bed ga, zorgen de vier Nest Protect rookmelders ervoor dat de overloop/zolder/woonkamer/hal (afhankelijk van waar je je bevindt) voldoende wordt verlicht zodat je nergens tegen omhoog loopt, maar ook niet klaarwakker wordt van de standaardverlichting. Mocht ik toch meer licht nodig hebben roep ik: "Hey Google. Licht aan!" of "Hey Google. Licht op 80%".

Als ik beneden in de woonkamer op de bank zit en zeg: "Hey Google. Speel Oppenheimer op TV", dan starten de LG G3, Denon AVR en Nvidia SHIELD TV Pro automatisch op en wordt de film afgespeeld op Plex vanaf mijn PMS. Na afloop van de film roep ik "Hey Google. TV uit" en alle apparatuur wordt (middels CEC) automatisch uitgeschakeld.

Het enige waarvoor ik een vooraf ingesteld schedule gebruik, zijn twee buitenlampen (voor- en achterdeur); die gaan 8min vóór zonsondergang aan en 6min ná zonsopgang weer uit. De overige tuinverlichting (twintig lampen) bedien ik fysiek met de dimmer-knoppen of met spraak. Als we op vakantie zijn laat ik een algoritme dit alles bepalen, om zo aanwezigheid te simuleren.

Als ik vraag "Hey Google. Wat is de temperatuur?" zonder het verder te specificeren, krijg ik de buitentemperatuur, de daadwerkelijke én ingestelde temperatuur van de airco's in de verschillende kamers en de woonkamer temperatuur afkomstig van de Toon thermostaat. Als ik de temperatuur wil verhogen of verlagen kan dat uiteraard ook met spraak. Wanneer ik alleen de temperatuur van onze slaapkamer wil weten terwijl ik elders in het huis ben, vraag ik "Hey Google. Hoe warm is het op de hoofdslaapkamer?".

TL;DR: Automatisering zonder spraakbesturing heeft slechts beperkt nut en is zijn charme lang geleden al verloren. Wil je optimaal van domotica genieten, dan mag spraakbediening niet ontbreken. Het is goed dat spraakassistentie ook zonder cloud implementatie mogelijk wordt gemaakt, want ik besef mij maar al te goed dat ik met mijn huidige implementatie privacy inlever.

[Reactie gewijzigd door boolean op 17 oktober 2023 13:47]

rene_fb
@boolean • 17 oktober 2023 11:02

Naja...
Her en der voegt spraak uiteraard iets toe (input is dan makkelijker dan met een toetsenbord o.i.d.), maar het meeste dat je beschrijft zijn acties welke door een trigger gestart worden, en kan net zo goed met een knop. Dat heeft weinig met de spraakherkenning an sich te maken.

boolean
@rene_fb • 17 oktober 2023 13:36

Dat is júíst de hele gedachte achter spraakbediening. In plaats van dat je driehonderd knoppen hebt (of ingewikkelde druk-combinaties), kun je uiteenlopende events met spraak triggeren. Als je in de bank zit en je wilt de verlichting inschakelen of van intensiteit wijzigen, dan wil je niet eerst een zoektocht naar je telefoon of tablet moeten ondernemen, want dan had je net zo goed op kunnen staan om naar de fysieke lichtschakelaar(s) te lopen.

[Reactie gewijzigd door boolean op 17 oktober 2023 15:50]

crazyx
@rene_fb • 17 oktober 2023 11:22

Uiteraard, maar dan heb je gewoon veel knoppen nodig om alle scenarios aan te kunnen.

Voor temperatuur instellen heb je daar ook weer wat extra's nodig.

Eerlijk gezegd lijkt de opstelling van boolean me netter dan met een half mengpaneel op de salontafel te hebben staan.

arjankoole
@GewoonWatSpulle • 16 oktober 2023 08:45

"Hey Google zet eettafel op 70%" hoe moet iemand die op onze katten past dat allemaal weten? Zet je gewoon de lampen aan 1 uur voor schemering met een extra offset voor verwachte bewolking?

Mijn oppas heeft geen flauw benul van domotica. Die gebruikt gewoon de schakelaar. Mijn partner ook. Ze zijn zich nauwelijks bewust dat er dingen op de achtergrond automatisch gebeuren. Met name mijn partner wil dat het gewoon werkt, wat betekend op het oog een ouderwetse interface. (Dat is het niet, maar het lijkt en werkt wel zo).

Die regel hanteer ik voor alles aan domotica. Leuk dat het allemaal met apps en commando’s kan. Maar het moet ook werken als het systeem plat ligt of internet stuk is. Daar ontwerp en bouw ik het op.

i-chat
@arjankoole • 16 oktober 2023 16:54

dat je het wilt laten werken onafhankelijk van de aanwezige internetverbinding snap ik wel want als je ooit overstapt storing hebt weet ik wat wil je natuurlijk wel gewoon je lampen aan kunnen zetten.

maar dat verhaal over die oppas daarin ga ik echt niet mee, iedereen die in mijn huis is mag zich conformeren aan mijn huis en niet andersom. jij wilt immers ook niet dat ik met mijn modderpoten je woonkamer in loop omdat ik dat thuis ook doe.

dus als ik morgen een nieuwbouw huis zo hebben en de aannemer vraagt waar de lichknoppen moeten dan is mijn antwoord vermoedelijk in de meterkast.

arjankoole
@i-chat • 18 oktober 2023 18:39

Ik deel mijn huis met onder andere een partner, die niets met domotica heeft, ze legt me geen beperkingen op, en verwacht derhalve ook dat ik niet mijn onzin aan haar opdring.

Zij wil gewoon aan en uit knoppen. En ik heb geen enkele behoefte mijn oppas te gaan opleggen een app te gebruiken voor ons huis. Dat is simpelweg onredelijk. Voor iedereen werkt alles zoals het hoort te werken. Al heb ik wat meer leuke features onder mijn vingertoppen.

PaulHelper
@GewoonWatSpulle • 16 oktober 2023 07:00

Ik ben het deels met je eens. Je wil zoveel mogelijk automatisch op basis van omgeving maar sommige dingen zijn nou eenmaal momentopnames en gevoelskwesties. De ene keer doe je als mens of wil je iets anders dan standaard en in zulke gevallen moet je toch echt een lamp aan of uitzetten of iets dergelijks. Voor dat stuk moet je tegenwoordig nog die acties helemaal fysiek uitvoeren. Met digitale bediening is dat al niet meer nodig en met slimme voice assistant kan dat mogelijk zelfs zonder je telefoon echt aan te raken. Dat is waar volgens mij het streven ligt.

Simkin
@GewoonWatSpulle • 16 oktober 2023 07:10

Het is een aanvulling, niet een vervanging

NLkaiser
@GewoonWatSpulle • 16 oktober 2023 08:22

Zo heb ik een automatisering dat als iedereen de deur uit is alles uit gaat omdat mijn lieftallige vrouw nog wel eens vergeet ergens iets uit te zetten, nu paste mijn moeder vandeweek bij ons thuis op onze dochter kreeg ik toch een appje uuh ik zit hier in het donker wat gebeurde er?

djwice
@GewoonWatSpulle • 16 oktober 2023 08:38

Wellicht een lux sensor gebruiken? Zit vaak op een weerstation. De informatie over bewolking die je via weather.com (IBM US) haalt is vaak zeer onnauwkeurig.
Maak eens een foto met lange sluitertijd van een blauwe lucht, en er komen wolken op die met het blote oog niet ziet.

Zelf gebruik ik gewoon zonnepanelen met batterijen, de lampen gaan aan als de batterijen niet meer geladen worden.

Op marktplaats zie een uitgebreide versie al voor €100,- https://www.marktplaats.n...carkits/q/parrot+mki9200/

[Reactie gewijzigd door djwice op 16 oktober 2023 16:09]

ultimasnake
@GewoonWatSpulle • 16 oktober 2023 08:59

Lamp aan 1 uur voor schemering is mooi, maar niet heel smart. Ben je wel thuis? Zit je wel in de kamer? Heb je de behoefte wel?

Alles is af te vangen ook voor je kattenoppas maar is uiteindelijk nooit ideaal.

Ik heb thuis nu al 3 jaar een bijna volledig slim huis maar fysieke (zigbee) schakelaars blijven uiteindelijk een must niet alleen voor visite.

Met je stem is gewoon niet snel genoeg en zelfs de slimme speakers van de bekende bedrijven verwarren nog al eens aan met uit of zelfs ‘specifieke kamer’ voor ‘mijn hele huis’… leuk als je kids slapen en google roept: ok ik zet 34 lampen aan

Een app is praktisch maat je hebt (hopelijk) niet 24/7 je telefoon op zak.

Wat ik vooral een slim huis slim vind maken zijn oplossingen zoals de lampen in de babykamer na schemering op slecht 10% velheid aan te zetten zodat de retina’s van mijn dochtertje niet uit d’r schedel branden (maar wel na een tweede keer klikken hoger als de speen niet gevonden kan worden) Of het afstemmen van helderheid boven de eettafel op die van de vide.

Natuurlijk wel een aantal zaken zoals tuinverlichting bij ‘aantal nits’ etc of licht aan in de woonkamer als ik s’nachts thuiskom zodat ik niet struikel over de katten opweg naar de schakelaar. Of thuis de robotstofzuigers aan het werkzetten als we uit huis zijn (na confirmatie) etc

The Lord
@GewoonWatSpulle • 16 oktober 2023 12:14

In de keuken best handig; 'Hey Google, zet een timer voor 45 minuten met de naam spruitjessmurrie.' scheelt gedoe met telefoon of een stapel kookwekkers als je verschillende bereidingstijden hebt voor een diner.

Trouwens vaak minder handig als je in goed <vul andere taal dan Nederlands in> een bepaald nummer/band vraagt af te spelen via b.v. Spotify. Die AI is gruwelijk discriminerend naar mensen die geen vloeiend Denglish of andere mix spreken. Gewoon weigeren in de juiste taal voor een deel van de zin te luisteren of spreken. En dat geldt zo een beetje voor alle gemixte zinnen; je moet gewoon maar je hele conversatie in de juiste taal doen die de A *kuch, kuch, kuch* I blieft. Pfft.

lenwar

@GewoonWatSpulle • 16 oktober 2023 13:13

Zo zie je dat iedereen andere wensen heeft.
Ik zou zelf niet willen dat lampen in 'leefruimtes' automatisch gaan. Wat ik wel wil, is dat wanneer ik ze aan zet dat ze automatisch de juiste helderheid/kleurtemperatuur aannemen op basis van de zonnestand en/of eventueel bewolking (dan wel omgevingslicht buiten)

Als ik nu tegen mijn spraakassistent zeg dat de lampen aan moeten (of dat ik op de knop op de muur klik), dan zet hij de lampen op basis van de huidige zonnestand (en/of tijd waar dat relevant is (slaapkamers van kinderen) en zo) aan en met de bijbehorende instelling.

DeadMetal
@GewoonWatSpulle • 16 oktober 2023 16:37

'hoe moet iemand die op onze katten past dat allemaal weten?'
Het een sluit het ander niet uit. Die oppas zou inderdaad nooit iets met spraak of met een app moeten hoeven doen.

Als ik mijn huis in de 'vakantiemodus' of 'oppas aanwezig' modus zet, dan werkt alles zo simpel mogelijk.
Dus een single, dubbel of triple klik op een Zigbee-knop bij een slaapkamer, bedient simpelweg die lamp middels aan/uit, met een gemiddelde felheid. Precies zoals men (als smarthome-leek) verwacht.

Echter, normaal gesproken zorgt een single-klik dat de lamp aangaat met een felheid die past bij het tijdstip op de dag, een dubbelklik als ik het veel feller wil (bijv. om een mug te zoeken...) en met een triple-click bedien ik de screens (ja die gaan normaal automatisch, maar ik wil alles kunnen overrulen met fysieke knoppen zonder een app nodig te hebben).

Stembesturing hier bovenop kan een verrijking zijn, om voor speciale situaties die je niet geautomatiseerd wil hebben, geen app te hoeven gebruiken.

[Reactie gewijzigd door DeadMetal op 16 oktober 2023 16:42]

Polderviking
@GewoonWatSpulle • 16 oktober 2023 12:47

Automatisering is bij mij ook absoluut het uitgangspunt maar je blijft toch altijd wel iets van handmatige interactie houden.

Dat hoeft van mij niet zo nodig via spraak, maar sommige mensen worden daar blij van.

Phoolie
@GewoonWatSpulle • 16 oktober 2023 17:25

De lamp 1 uur voor schemering aanzetten is toch ook niet heel erg smart? In dat geval gaat je lamp altijd aan, ook als je niet thuis bent of in een andere ruimte.

Nou ben ik het met je eens dat spraak ook niet heel erg smart is. Iets is pas echt smart als het "vanzelf" gaat. Maar het is wel een fijne toevoeging, om bijvoorbeeld een radiozender naar keuze of een film op te zetten. Ook in situaties waar keuzes mogelijk zijn, kan je de vraag laten stellen en beantwoorden via spraak.

gaskabouter
@GewoonWatSpulle • 16 oktober 2023 20:20

Het werkt bij ons prima. Ook oma kan ermee overweg maar ik heb ook voor alles ook nog gewoon fysieke knoppen. Zodra oma door had dat ze niet hoefde op te staan om de lampen te regelen had ze het zo onder de knie.
En ook veel volgens schema en met sensoren. Dat scheelt ook een hoop inderdaad

[Reactie gewijzigd door gaskabouter op 16 oktober 2023 20:21]

knights16
@GewoonWatSpulle • 16 oktober 2023 21:25

Eens. Echter hebben wij best wel eens behoefte om die 70 procent wat te dimmen en dan is het soms handig dat je met een voice commando dit kan realiseren. Je hoeft dan niet naar de fysieke lichtknop (die wij nog hebben Shelly spul)

MrMonkE
16 oktober 2023 08:26

Kun je dit vanaf je telefoon inspreken op de HA app? (IPhone)

MarnickS
@MrMonkE • 16 oktober 2023 09:27

Ja, op Android kun je hem ook als standaard-assistent instellen. Ik weet niet of dat op iOS kan.

MrMonkE
@MarnickS • 16 oktober 2023 10:31

Hmm.. ik heb nog wel een oude android liggen.
Misschien daarop aan de slag gaan.

Kjoe_Ljan
@MrMonkE • 16 oktober 2023 10:33

Zoals MarnickS aangeeft, kan op Android Home Assistant als de standaard assistent worden ingesteld. Op iOS kan dat niet.
Je kunt wel opdrachten typen in de HA app op iOS, en je kunt de microfoon gebruiken om die opdrachten in te spreken. Dat was in elk geval de meest genoemde oplossing toen ik er een paar maanden geleden naar zocht.

Of het ondertussen mogelijk is om Apples spraakherkenning te omzeilen en volledig je eigen in-home spraakherkenning te gebruiken in iOS weet ik niet.

markee
@Kjoe_Ljan • 19 oktober 2023 12:53

Ik ben benieuwd of dit niet middels shortcuts kan? Ik ben daarin een leek, maar ik las op LinkedIn iemand die een shortcut had gemaakt om met ChatGPT te praten. Ik geloof dat hij tegen Siri iets kon zeggen als; 'Hey Siri, ik wil met ChatGPT praten.' Verder weet ik er ook niets van, want ik heb het niet getest en ben een leek.

Maar kan zoiets dan niet met een koppeling met de Home Assistant app?

swhnld

16 oktober 2023 06:29

Mooi artikel over een doe het zelf spraakassistent.
Echter vergeet niet een goede backup zodra ingeregeld, je wilt het niet kwijt raken na al het harde werk om het in te regelen.

MrMonkE
@swhnld • 16 oktober 2023 07:19

Backups kun je inregelen. En bij elke update van HA worden er backups gemaakt.
Dit is echt iets dat ze in HA wel goed gedaan hebben vind ik.
Let wel op dat je niet je data per ongeluk backupped

(Tenzij je die wilt backuppen)

MichaelB74
16 oktober 2023 09:32

Dit stukje is toch wel te ondervangen?
"In ruil voor privacy verliest je wel functionaliteit, want hoe je ook je best doet, een lokaal platform beschikt niet over allerlei actuele weetjes en feiten, dus daar hoef je een lokale spraakassistent niet naar te vragen. "

Als je de assistent de mogelijkheid geeft om zaken op internet op te zoeken, alleen wanneer dat nodig is, maar voor de rest geen andere zaken doorgeeft.

Redstone
@MichaelB74 • 16 oktober 2023 15:41

O zo makkelijk, ik zie de pull-aanvragen te gemoed.

coen254
@Redstone • 20 oktober 2023 15:57

Zijn het dan geen trek-aanvragen?

Breinier
@MichaelB74 • 18 oktober 2023 09:53

Klopt, het is al te ondervangen! Ik draai lokaal een 7B LLM (Mistral) dat gewoon doodleuk weetjes en feitjes kan beantwoorden, zonder internet toegang.

Orangelights23
16 oktober 2023 07:52

Volgens mij kun je een lokaal spraakassistent actueel houden door te koppelen met LangChain, zag daar iets voorbij van komen op YouTube. Maar dat maakt dan wel weer gebruik van OpenAI en daarmee geef je wel weer privacy weg.

SPee
@Orangelights23 • 16 oktober 2023 14:11

Volgens mij is LangChain juist bedoeld om meerdere modellen te kunnen gebruiken en hoef je dus niet specifiek OpenAI te gebruiken, maar kun je ook je eigen AI gebruiken.
In veel gevallen wordt OpenAI (als voorbeeld) gebruikt, omdat het een goed en bruikbaar model is. Voor een soortgelijk model zelf te draaien heb je een goede computer nodig. Of je gebruikt een simpeler model, wat minder herkenning heeft.

Breinier
@Orangelights23 • 18 oktober 2023 09:57

Gewoon Mistral lokaal draaien. Dat is op dit moment de beste en kleinste (7B) open source LLM die zonder internet gewoon vragen kan beantwoorden

pentode
16 oktober 2023 11:35

Gebruik al ruim een jaar lang de Seeed ReSpeaker in combinatie met Rhasspy in Home Assistant.

Zie video voorbeeld ff uit de losse pols op yt:
Spraak assistent zonder internet, huh?

Het off the grid zoals in de kop van het het artikel dat sprak mij wel aan. Wilde het wel eens uitproberen of dit bespreek ehh werkbaar is/was. En het werkt imho verbazend goed. En in het Nederlands. Nou ja Vlaams.
Je moet wel beginnen met het wake woord. En dat wordt nog wel eens vergeten ;-P

Het is een ander "interactie(f) concept" naast oa touch display's. En het automatiseren.
Off topic: zie hackaday artikel over gesture based remote control. Of we dat allemaal gaan doen. Dan kun je het uiteindelijk schudden met rsi.

Terzijde:
In de Zorg werkend als Social Worker heeft iemand de ziekte van Parkinson. De handen schokken, trillen.
Het bedienen van een touch device is geen sinecure. Ook met een pennetje lastig.
Spraak bediening biedt uitkomst. In het kader van totale communicatie. /terzijde

Lokale spraak besturing heeft anno nu nog een hoog knutsel gehalte. Voor mij niet in negatieve zin. Elk jaar rond hacktober verzin ik weer wat nieuws. Om te bouwen met programmeerbare elektronica. Als het weer zo lelijk doet.
En je moet onder andere aan de slag met de rhasspy config files. Maar dat heeft ook zo zijn charme.
Maar is niet voor iedereen weggelegd.

Helaas wordt door Seed the repository op github niet meer bijgehouden. Rhasspy heeft een community forum.

Kjoe_Ljan
16 oktober 2023 11:54

Jammer dat de M5Stack Atom Echo toch niet ideaal blijkt. Het heet worden van het apparaat (en bijbehorende brandlucht) is volgens mij een bekend probleem, wanneer de microfoon aan staat. En dat wil je natuurlijk wel, als je wilt reageren op wake words.

Alternatieven van de Atom Echo worden al snel een stuk groter (en ik gok minder energie zuinig).

Sir Dancelot
16 oktober 2023 12:00

Interessant! Het draait ook op Docker, dus dan wordt experimenteren toegankelijker. Ga kijken of mn Synology NAS dit trekt...

Tusk
16 oktober 2023 12:23

Ik ben zo klaar met de steeds slechter wordende werking van Google Nest. Simpele commando's in totale stilte van dichtbij gewoon pas na de 3e keer snappen...

Ik heb al wat geprobeerd met de Home Assistent integraties, maar krijg dat niet goed werkend. Cpu verbruik van mijn pi4 flipt hem helemaal, dus dat heb ik er weer afgegooid.

Wat ik voor ogen heb is een NUC (voor rekenkracht) in te richten met Rhassy, een oude conference unit (USB of RJ45) aansluiten en een koppeling maken met Home Assistant op mijn Pi. Kan dit werken denken jullie?

Roel1966

16 oktober 2023 18:43

Buiten privacy stoort mij nog het meest dat alle slimme apparaten niet meer werken wanneer internet uit valt en je dus zo afhankelijk bent van internet. Alleen om die rede zou ik dus graag willen dat alles lokaal werkt of in elk geval lokaal kan blijven werken. Maar punt blijft dat de hardware ervoor nu eenmaal niet goedkoop is zeker als je op meerdere plaatsen een assistent wilt gebruiken.

Ik hoop dat er eens een fabrikant op het slimme plan komt iets te ontwikkelen zoals b.v. een Google Nest maar dan dus met lokale bediening. Dit dan voor concurrerende prijzen en als kant en klaar pakket voor de mensen die dan niet zo handig zijn met elektronica. Denk ook wel dat dit er zal gaan komen als de ontwikkelingen zoals deze in dit artikel zich voortzetten.

1 2 Volgende

Op dit item kan niet meer gereageerd worden.

Spraakassistentie zonder cloud

Conclusie

Platforms

Hardware

Toekomstvast knutselproject

Inhoudsopgave

Lees meer

Reacties (79)

Sorteer op:

Weergave:

Tweakers maakt gebruik van cookies

Toestemming beheren

Functioneel en analytisch

Relevantere advertenties

Ingesloten content van derden