Conversando sobre o estado do hacker
Há muitos na comunidade de hackers que adorariam experimentar a realidade aumentada (AR), mas o cenário de hardware não está exatamente repleto de opções que se alinham com nossos objetivos e prioridades. As ofertas comerciais, do Google Glass ao Microsoft HoloLens e ao Magic Leap 2, visam principalmente clientes médicos e aeroespaciais e têm preços correspondentes. No lado amador do espectro orçamentário, ficamos com vários fones de ouvido que permitem que você se encaixe em um smartphone padrão, mas, como seus equivalentes de realidade virtual (VR), eles dificilmente podem ser comparados com equipamentos específicos.
Mas há esperança - a Brilliant Labs está trabalhando em dispositivos AR que preenchem todos os nossos requisitos: acessíveis, fáceis de interagir e, o melhor de tudo, desenvolvidos para serem o mais abertos possível desde o início. É certo que seu primeiro produto, Monocle, é um tanto simplista em comparação com o que os grandes jogadores estão oferecendo. Mas pelo nosso dinheiro, preferimos ter algo construído para ser hackeado e experimentado. De que adiantam todos os recursos e capacidades mais recentes quando você nem consegue colocar as mãos no SDK oficial?
Esta semana, convidamos o chefe de engenharia do Brilliant Lab, Raj Nakaraja, para o Hack Chat para falar sobre AR, Monocle e o futuro do código aberto neste espaço dominado por hardware e software proprietários.
Naturalmente, o bate-papo começou com perguntas sobre como o Monocle funciona e, especificamente, como exatamente ele se parece quando você o está usando. Comparado a outros dispositivos que tentam preencher todo o seu campo de visão com gráficos de alta resolução, o Monocle usa um pequeno OLED Sony ECX336CN 640 x 400 brilhando através de um divisor de feixe colocado na frente do olho do usuário. O resultado final é uma experiência que Raj descreve como uma "tela de tablet à distância de um braço" posicionada alguns graus abaixo do centro de sua visão. Ver o que está no Monocle é bastante natural - é como olhar para baixo de um filme para ver seu telefone.
Para um produto comercial, a documentação do Monocle é excelente. Só poderíamos sonhar com um mundo em que todo o hardware que comprássemos viesse com esse tipo de informação. Esquemas e modelos 3D estão disponíveis, e há extensa orientação disponível para o lado do software, explicando como você pode criar suas próprias atualizações over-the-air (OTA).
Dito isso, seria difícil construir um Monóculo sozinho. Raj diz que o aspecto da fabricação foi um desafio considerável e levou algum tempo para encontrar um parceiro que pudesse realmente produzir a ótica necessária. Múltiplos componentes ópticos moldados por injeção precisam ser ligados a si mesmos e ao próprio OLED com uma cola óptica especial. A Brilliant Labs patenteou esta parte do Monocle, mas Raj diz que isso foi principalmente para afastar os trolls de patentes e convidou os participantes do Chat para conferir se queriam ler mais sobre o trabalho que foi feito.
Apesar de seu tamanho pequeno, há uma quantidade impressionante de hardware no Monocle, incluindo um FPGA usado para fornecer aceleração gráfica. Todos esses componentes consomem uma boa quantidade de energia e, mesmo com o gerenciamento de energia integrado, a bateria interna de 70 mAh do dispositivo não o levará até certo ponto.
Raj diz que você pode obter cerca de 45 minutos de tempo de execução do Monocle em uso normal e aproximadamente metade disso se estiver gravando usando sua câmera Omnivision OV5640 de 5 MP. No lado positivo, o Monocle vem com um estojo de carregamento com capacidade suficiente para recarregar o dispositivo seis vezes.
Detalhes de hardware à parte, vários no bate-papo perguntaram que tipo de coisas os hackers poderiam fazer de forma realista com o AR. Naturalmente, é aqui que alguma imaginação é necessária. Mas pelo menos no caso do Monocle, todo o software é essencialmente Python, então é muito fácil conectar o que você quiser. Raj aponta alguns exemplos, como um usuário que vinculou seu Monocle ao ChatGPT - o dispositivo ouvia o que estava sendo dito ao usuário, inseria no modelo de linguagem e exibia secretamente a resposta apropriada na tela. Obviamente, era um projeto irônico, mas com alguns ajustes, poderia ser usado como uma espécie de tradutor universal.