Move lexer code to lexer.c file

author: Bad Diode <bd@badd10de.dev> 2024-06-15 16:52:36 +0200
committer: Bad Diode <bd@badd10de.dev> 2024-06-15 16:52:36 +0200
commit: e7cd0d47a603e4199b0ee7daa2434fc0db602bad (patch)
tree: 511cfbe2cea66e45b4ca7669ed9a101763ae3537
parent: 893b52223d274c675272cee55768a9d5853420fb (diff)
download: bdl-e7cd0d47a603e4199b0ee7daa2434fc0db602bad.tar.gz
bdl-e7cd0d47a603e4199b0ee7daa2434fc0db602bad.zip
4 files changed, 532 insertions, 935 deletions
diff --git a/Makefile b/Makefile
index 45c1389..4e66983 100644
--- a/Makefile
+++ b/Makefile
@@ -43,9 +43,6 @@ $(BIN): $(SRC_MAIN) $(WATCH_SRC) $(BUILD_DIR)
 $(BUILD_DIR):
        mkdir -p $(BUILD_DIR)
-tests: $(BIN)
-        ./$(BIN) tests/constants/numbers.bdl
 run: $(BIN)
        $(BIN) tests/literals.bad
diff --git a/src/lexer.c b/src/lexer.c
index a6d7c74..df998f2 100644
--- a/src/lexer.c
+++ b/src/lexer.c
@@ -1,130 +1,192 @@
-#include "lexer.h"
+#define LEXER_MEM GB(2)
-#include "errors.h"
+typedef enum TokenType {
-static const char* token_str[] = {
+    TOK_UNKNOWN = 0,
-    [TOKEN_UNKNOWN] = "UNKNOWN",
-    [TOKEN_LPAREN]  = "LPAREN",
+    // Parentheses.
-    [TOKEN_RPAREN]  = "RPAREN",
+    TOK_LPAREN,   // (
-    [TOKEN_LSQUARE] = "LSQUARE",
+    TOK_RPAREN,   // )
-    [TOKEN_RSQUARE] = "RSQUARE",
+    TOK_LSQUARE,  // [
-    [TOKEN_LCURLY]  = "LCURLY",
+    TOK_RSQUARE,  // ]
-    [TOKEN_RCURLY]  = "RCURLY",
+    TOK_LCURLY,   // {
-    [TOKEN_NUMBER]  = "NUMBER",
+    TOK_RCURLY,   // }
-    [TOKEN_SYMBOL]  = "SYMBOL",
-    [TOKEN_STRING]  = "STRING",
+    // Basic literals.
-    [TOKEN_NIL]     = "NIL",
+    TOK_NUMBER,
-    [TOKEN_TRUE]    = "TRUE",
+    TOK_SYMBOL,
-    [TOKEN_FALSE]   = "FALSE",
+    TOK_STRING,
-    [TOKEN_LAMBDA]  = "LAMBDA",
-    [TOKEN_IF]      = "IF",
+    // Keywords.
-    [TOKEN_DEF]     = "DEF",
+    TOK_BREAK,     // break
-    [TOKEN_SET]     = "SET",
+    TOK_CASE,      // case
-    [TOKEN_FUN]     = "FUN",
+    TOK_CONTINUE,  // continue
-    [TOKEN_STRUCT]  = "STRUCT",
+    TOK_FALSE,     // false
-    [TOKEN_ADD]     = "ADD",
+    TOK_FUN,       // fun
-    [TOKEN_SUB]     = "SUB",
+    TOK_IF,        // if
-    [TOKEN_MUL]     = "MUL",
+    TOK_LET,       // let
-    [TOKEN_DIV]     = "DIV",
+    TOK_MATCH,     // match
-    [TOKEN_MOD]     = "MOD",
+    TOK_NIL,       // nil
-    [TOKEN_NOT]     = "NOT",
+    TOK_RETURN,    // return
-    [TOKEN_AND]     = "AND",
+    TOK_SET,       // set
-    [TOKEN_OR]      = "OR",
+    TOK_STRUCT,    // struct
-    [TOKEN_EQ]      = "EQ",
+    TOK_TRUE,      // true
-    [TOKEN_LT]      = "LT",
+    TOK_WHILE,     // while
-    [TOKEN_GT]      = "GT",
-    [TOKEN_LE]      = "LE",
+    // Arithmetic ops.
-    [TOKEN_GE]      = "GE",
+    TOK_ADD,  // +
-    [TOKEN_COLON]   = "COLON",
+    TOK_SUB,  // -
-    [TOKEN_DOT]     = "DOT",
+    TOK_MUL,  // *
-    [TOKEN_AT]      = "AT",
+    TOK_DIV,  // /
-    [TOKEN_EOF]     = "EOF",
+    TOK_MOD,  // %
-};
+    // Logical ops.
+    TOK_NOT,    // !
+    TOK_AND,    // &&
+    TOK_OR,     // ||
+    TOK_EQ,     // ==
+    TOK_NOTEQ,  // !=
+    TOK_LT,     // <
+    TOK_GT,     // >
+    TOK_LE,     // <=
+    TOK_GE,     // >=
+    // Bitwise ops.
+    TOK_BITNOT,     // ~
+    TOK_BITAND,     // &
+    TOK_BITOR,      // |
+    TOK_BITLSHIFT,  // <<
+    TOK_BITRSHIFT,  // >>
+    // Special ops.
+    TOK_COLON,   // :
+    TOK_DOT,     // .
+    TOK_AT,      // @
+    TOK_ASSIGN,  // =
+    // End of file.
+    TOK_EOF,
+} TokenType;
+Str token_str[] = {
+    [TOK_UNKNOWN] = cstr("UNKNOWN"),
+    // Parentheses.
+    [TOK_LPAREN] = cstr("LPAREN"),
+    [TOK_RPAREN] = cstr("RPAREN"),
+    [TOK_LSQUARE] = cstr("LSQUARE"),
+    [TOK_RSQUARE] = cstr("RSQUARE"),
+    [TOK_LCURLY] = cstr("LCURLY"),
+    [TOK_RCURLY] = cstr("RCURLY"),
+    // Basic literals.
+    [TOK_NUMBER] = cstr("NUMBER"),
+    [TOK_SYMBOL] = cstr("SYMBOL"),
+    [TOK_STRING] = cstr("STRING"),
+    // Keywords.
+    [TOK_BREAK] = cstr("BREAK"),
+    [TOK_CASE] = cstr("CASE"),
+    [TOK_CONTINUE] = cstr("CONTINUE"),
+    [TOK_FALSE] = cstr("FALSE"),
+    [TOK_FUN] = cstr("FUN"),
+    [TOK_IF] = cstr("IF"),
+    [TOK_LET] = cstr("LET"),
+    [TOK_MATCH] = cstr("MATCH"),
+    [TOK_NIL] = cstr("NIL"),
+    [TOK_RETURN] = cstr("RETURN"),
+    [TOK_SET] = cstr("SET"),
+    [TOK_STRUCT] = cstr("STRUCT"),
+    [TOK_TRUE] = cstr("TRUE"),
+    [TOK_WHILE] = cstr("WHILE"),
+    // Arithmetic ops.
+    [TOK_ADD] = cstr("ADD"),
+    [TOK_SUB] = cstr("SUB"),
+    [TOK_MUL] = cstr("MUL"),
+    [TOK_DIV] = cstr("DIV"),
+    [TOK_MOD] = cstr("MOD"),
-typedef struct Keyword {
+    // Logical ops.
-    char *str;
+    [TOK_NOT] = cstr("NOT"),
-    size_t n;
+    [TOK_AND] = cstr("AND"),
-    TokenType token;
+    [TOK_OR] = cstr("OR"),
-} Keyword;
+    [TOK_EQ] = cstr("EQ"),
+    [TOK_NOTEQ] = cstr("NOTEQ"),
-#define KEYWORD(STR,TOK) {(STR), sizeof(STR) - 1, (TOK)}
+    [TOK_LT] = cstr("LT"),
+    [TOK_GT] = cstr("GT"),
-static const Keyword keywords[] = {
+    [TOK_LE] = cstr("LE"),
-    KEYWORD("nil",    TOKEN_NIL),
+    [TOK_GE] = cstr("GE"),
-    KEYWORD("true",   TOKEN_TRUE),
-    KEYWORD("false",  TOKEN_FALSE),
+    // Bitwise ops.
-    KEYWORD("lambda", TOKEN_LAMBDA),
+    [TOK_BITNOT] = cstr("BITNOT"),
-    KEYWORD("if",     TOKEN_IF),
+    [TOK_BITAND] = cstr("BITAND"),
-    KEYWORD("def",    TOKEN_DEF),
+    [TOK_BITOR] = cstr("BITOR"),
-    KEYWORD("set",    TOKEN_SET),
+    [TOK_BITLSHIFT] = cstr("BITLSHIFT"),
-    KEYWORD("fun",    TOKEN_FUN),
+    [TOK_BITRSHIFT] = cstr("BITRSHIFT"),
-    KEYWORD("struct", TOKEN_STRUCT),
-    KEYWORD("+",      TOKEN_ADD),
+    // Special ops.
-    KEYWORD("-",      TOKEN_SUB),
+    [TOK_COLON] = cstr("COLON"),
-    KEYWORD("*",      TOKEN_MUL),
+    [TOK_DOT] = cstr("DOT"),
-    KEYWORD("/",      TOKEN_DIV),
+    [TOK_AT] = cstr("AT"),
-    KEYWORD("%",      TOKEN_MOD),
+    [TOK_ASSIGN] = cstr("ASSIGN"),
-    KEYWORD("not",    TOKEN_NOT),
-    KEYWORD("and",    TOKEN_AND),
+    // End of file.
-    KEYWORD("or",     TOKEN_OR),
+    [TOK_EOF] = cstr("EOF"),
-    KEYWORD("=",      TOKEN_EQ),
-    KEYWORD("<",      TOKEN_LT),
-    KEYWORD(">",      TOKEN_GT),
-    KEYWORD("<=",     TOKEN_LE),
-    KEYWORD(">=",     TOKEN_GE),
 };
-void
+typedef struct Token {
-print_token(Token tok) {
+    TokenType type;
-    printf("[%4ld:%-4ld] ", tok.line, tok.col);
+    Str val;
-    printf("%s", token_str[tok.type]);
+    sz line;
-    switch (tok.type) {
+    sz col;
-        case TOKEN_NUMBER:
+} Token;
-        case TOKEN_SYMBOL:
-        case TOKEN_STRING: {
+typedef struct Scanner {
-            printf(" -> ");
+    Str str;
-            sv_write(&tok.value);
+    sz line;
-        } break;
+    sz col;
-        default: {
+} Scanner;
-        } break;
-    }
-    printf("\n");
-}
 char
 scan_next(Scanner *scanner) {
-    char c = sv_next(&scanner->current);
+    char c = str_next(&scanner->str);
    if (c == '\n') {
-        scanner->line_number++;
+        scanner->line++;
-        scanner->col_number = 1;
+        scanner->col = 0;
    } else {
-        scanner->col_number++;
+        scanner->col++;
    }
-    scanner->offset++;
    return c;
 }
-void
+bool
-scan_rewind(Scanner *scanner) {
+scan_has_next(Scanner *scanner) {
-    sv_rewind(&scanner->current);
+    return scanner->str.size;
-    scanner->offset--;
 }
 char
-scan_peek(const Scanner *scanner) {
+scan_peek(Scanner *scanner) {
-    return sv_peek(&scanner->current);
+    return str_peek(scanner->str);
 }
-bool
+void
-scan_has_next(const Scanner *scanner) {
+scan_skip_line(Scanner *scanner) {
-    return scanner->current.n != 0;
+    SearchResult newline = array_find_next(scanner->str, cstr("\n"));
+    if (newline.found) {
+        scanner->str.mem += newline.pos + 1;
+        scanner->str.size -= newline.pos + 1;
+        scanner->line++;
+        scanner->col = 0;
+    }
 }
 void
-skip_whitespace(Scanner *scanner) {
+scan_skip_whitespace(Scanner *scanner) {
    while (scan_has_next(scanner)) {
        char c = scan_peek(scanner);
        switch (c) {
            case ' ':
+            case ',':  // Commas are just syntactic sugar.
            case '\f':
            case '\n':
            case '\r':
@@ -132,6 +194,10 @@ skip_whitespace(Scanner *scanner) {
            case '\v': {
                scan_next(scanner);
            } break;
+            case ';': {
+                // Found a comment! (skip)
+                scan_skip_line(scanner);
+            } break;
            default: {
                return;
            } break;
@@ -140,22 +206,33 @@ skip_whitespace(Scanner *scanner) {
 }
 bool
-is_delimiter(char c) {
+scan_is_valid_split(char c) {
    switch (c) {
-        case EOF:
-        case '\0':
        case ';':
-        case '"':
-        case '\'':
        case '(':
        case ')':
        case '[':
        case ']':
        case '{':
        case '}':
+        case '+':
+        case '-':
+        case '*':
+        case '/':
+        case '%':
+        case '!':
+        case '=':
+        case '<':
+        case '>':
+        case '~':
+        case '&':
+        case '|':
        case ':':
+        case '.':
        case '@':
+        case '"':
        case ' ':
+        case ',':
        case '\f':
        case '\n':
        case '\r':
@@ -167,122 +244,351 @@ is_delimiter(char c) {
    return false;
 }
-TokenType
+void
-find_token_type(const StringView value) {
+scan_skip_until_valid(Scanner *scanner) {
-    for (size_t i = 0; i < sizeof(keywords) / sizeof(Keyword); i++) {
+    while (scan_has_next(scanner)) {
-        StringView keyword = (StringView){keywords[i].str, keywords[i].n};
+        char c = scan_peek(scanner);
-        if (sv_equal(&value, &keyword)) {
+        if (scan_is_valid_split(c)) {
-            return keywords[i].token;
+            return;
        }
+        scan_next(scanner);
    }
-    return TOKEN_SYMBOL;
 }
-void
+Token
-print_tokens(Token *tokens) {
+emit_token(Scanner current, Scanner *scanner, TokenType t) {
-    for (size_t i = 0; i < array_size(tokens); i++) {
+    Str val = current.str;
-        print_token(tokens[i]);
+    val.size = current.str.size - scanner->str.size;
-    }
+    val.size = val.size < 0 ? 0 : val.size;
+    return (Token){
+        .val = val,
+        .line = current.line + 1,
+        .col = current.col + 1,
+        .type = t,
+    };
 }
-Token *
+Token
-tokenize(const StringView *sv) {
+emit_token_err(Scanner *scanner, Str err_msg) {
-    Token *tokens = NULL;
+    return (Token){
-    array_init(tokens, 1);
+        .line = scanner->line + 1,
-    Scanner scanner = (Scanner){
+        .col = scanner->col + 1,
-        .current = *sv,
+        .val = err_msg,
-        .line_number = 1,
+        .type = TOK_UNKNOWN,
-        .col_number = 1,
    };
+}
-    while (scan_has_next(&scanner)) {
+Token
-        skip_whitespace(&scanner);
+emit_token_number(Scanner *scanner) {
-        size_t line = scanner.line_number;
+    Scanner current = *scanner;
-        size_t col = scanner.col_number;
+    char c = scan_peek(scanner);
-        size_t offset = scanner.offset;
+    if (c == '+' || c == '-') {
-        Token token = (Token){
+        scan_next(scanner);
-            .type = TOKEN_UNKNOWN,
+        if (str_has_prefix(scanner->str, cstr("0b")) ||
-            .line = line,
+            str_has_prefix(scanner->str, cstr("0x"))) {
-            .col = col,
+            scan_skip_until_valid(scanner);
-        };
+            return emit_token_err(
-        char c = scan_next(&scanner);
+                &current,
-        switch (c) {
+                cstr("malformed number: binary/hex numbers can't be signed"));
-            case ';': {
+        }
-                while ((c = scan_next(&scanner)) != '\n' && c != '\0') {}
+    }
+    if (str_has_prefix(scanner->str, cstr("0b"))) {
+        scan_next(scanner);
+        scan_next(scanner);
+        while (scan_has_next(scanner)) {
+            c = scan_peek(scanner);
+            if (c == '0' || c == '1' || c == '_') {
+                scan_next(scanner);
                continue;
-            } break;
+            }
-            case '"': {
+            if (scan_is_valid_split(c)) {
-                char prev = c;
+                return emit_token(current, scanner, TOK_NUMBER);
-                bool found = false;
+            }
-                size_t n = 0;
+            scan_skip_until_valid(scanner);
-                while (scan_has_next(&scanner)) {
+            return emit_token_err(
-                    c = scan_next(&scanner);
+                &current, cstr("malformed number: invalid binary number"));
-                    if (c == '"' && prev != '\\') {
+        }
-                        found = true;
+    } else if (str_has_prefix(scanner->str, cstr("0x"))) {
-                        break;
+        scan_next(scanner);
-                    }
+        scan_next(scanner);
-                    prev = c;
+        while (scan_has_next(scanner)) {
-                    n++;
+            c = scan_peek(scanner);
-                }
+            if ((c >= '0' && c <= '9') || (c >= 'a' && c <= 'f') ||
-                if (!found) {
+                (c >= 'A' && c <= 'F') || c == '_') {
-                    push_error(ERR_TYPE_LEXER, ERR_UNMATCHED_STRING, line, col);
+                scan_next(scanner);
-                    return tokens;
+                continue;
-                }
+            }
-                token.value = (StringView){
+            if (scan_is_valid_split(c)) {
-                    .start = &sv->start[offset + 1],
+                return emit_token(current, scanner, TOK_NUMBER);
-                    .n = n,
+            }
-                };
+            scan_skip_until_valid(scanner);
-                token.type = TOKEN_STRING;
+            return emit_token_err(&current,
-            } break;
+                                  cstr("malformed number: invalid hex number"));
-            case '(': { token.type = TOKEN_LPAREN; } break;
+        }
-            case ')': { token.type = TOKEN_RPAREN; } break;
+    } else {
-            case '[': { token.type = TOKEN_LSQUARE; } break;
+        // Integral.
-            case ']': { token.type = TOKEN_RSQUARE; } break;
+        while (scan_has_next(scanner)) {
-            case '{': { token.type = TOKEN_LCURLY; } break;
+            c = scan_peek(scanner);
-            case '}': { token.type = TOKEN_RCURLY; } break;
+            if (c == '.') {
-            case ':': { token.type = TOKEN_COLON; } break;
+                scan_next(scanner);
-            case '.': { token.type = TOKEN_DOT; } break;
+                break;
-            case '@': { token.type = TOKEN_AT; } break;
+            }
-            default: {
+            if ((c >= '0' && c <= '9') || c == '_') {
-                if (c == EOF || c == '\0') {
+                scan_next(scanner);
-                    token.type = TOKEN_EOF;
+                continue;
-                    break;
+            }
-                }
+            if (scan_is_valid_split(c)) {
-                size_t n = 1;
+                return emit_token(current, scanner, TOK_NUMBER);
-                bool num = c == '-' && !is_delimiter(scan_peek(&scanner));
+            }
-                num = num || (c == '+' && !is_delimiter(scan_peek(&scanner)));
+            scan_skip_until_valid(scanner);
-                num = num || (c >= '0' && c <= '9');
+            return emit_token_err(&current, cstr("malformed number"));
-                if (num) {
+        }
-                    while (!is_delimiter(scan_peek(&scanner))) {
+        c = scan_peek(scanner);
-                        c = scan_next(&scanner);
+        if (!(c >= '0' && c <= '9')) {
-                        n++;
+            return emit_token_err(&current,
-                    }
+                                  cstr("malformed number: no decimal digits"));
-                    token.value = (StringView){
+        }
-                        .start = &sv->start[offset],
+        // Decimals.
-                        .n = n,
+        while (scan_has_next(scanner)) {
-                    };
+            c = scan_peek(scanner);
-                    token.type = TOKEN_NUMBER;
+            if (c == 'e' || c == 'E') {
-                } else {
+                scan_next(scanner);
-                    while (!is_delimiter(scan_peek(&scanner))) {
+                break;
-                        if (scan_peek(&scanner) == '.') {
+            }
-                            break;
+            if ((c >= '0' && c <= '9') || c == '_') {
-                        }
+                scan_next(scanner);
-                        c = scan_next(&scanner);
+                continue;
-                        n++;
+            }
-                    }
+            if (scan_is_valid_split(c)) {
-                    token.value = (StringView){
+                return emit_token(current, scanner, TOK_NUMBER);
-                        .start = &sv->start[offset],
+            }
-                        .n = n,
+            scan_skip_until_valid(scanner);
-                    };
+            return emit_token_err(&current, cstr("malformed number"));
-                    token.type = find_token_type(token.value);
-                }
-            } break;
        }
-        if (token.type == TOKEN_UNKNOWN) {
+        // Exponent.
-            push_error(ERR_TYPE_LEXER, ERR_UNKNOWN_TOK_TYPE, line, col);
+        c = scan_peek(scanner);
-            return tokens;
+        if (c == '+' || c == '-') {
+            scan_next(scanner);
        }
-        array_push(tokens, token);
+        while (scan_has_next(scanner)) {
+            c = scan_peek(scanner);
+            if ((c >= '0' && c <= '9') || c == '_') {
+                scan_next(scanner);
+                continue;
+            }
+            if (c == '.') {
+                scan_next(scanner);
+                return emit_token_err(
+                    &current,
+                    cstr("malformed number: decimals not allowed on exponent"));
+            }
+            if (scan_is_valid_split(c)) {
+                return emit_token(current, scanner, TOK_NUMBER);
+            }
+            scan_skip_until_valid(scanner);
+            return emit_token_err(&current, cstr("malformed number"));
+        }
+    }
+    return emit_token_err(&current, cstr("malformed number"));
+}
+Token
+scan_token(Scanner *scanner) {
+    assert(scanner);
+    scan_skip_whitespace(scanner);
+    if (!scan_has_next(scanner)) {
+        return emit_token(*scanner, scanner, TOK_EOF);
+    }
+    Scanner current = *scanner;
+    char c = scan_next(scanner);
+    switch (c) {
+        case '(':
+            return emit_token(current, scanner, TOK_LPAREN);
+        case ')':
+            return emit_token(current, scanner, TOK_RPAREN);
+        case '[':
+            return emit_token(current, scanner, TOK_LSQUARE);
+        case ']':
+            return emit_token(current, scanner, TOK_RSQUARE);
+        case '{':
+            return emit_token(current, scanner, TOK_LCURLY);
+        case '}':
+            return emit_token(current, scanner, TOK_RCURLY);
+        case '+': {
+            char p = scan_peek(scanner);
+            if (p >= '0' && p <= '9') {
+                *scanner = current;
+                return emit_token_number(scanner);
+            }
+            return emit_token(current, scanner, TOK_ADD);
+        };
+        case '-': {
+            char p = scan_peek(scanner);
+            if (p >= '0' && p <= '9') {
+                *scanner = current;
+                return emit_token_number(scanner);
+            }
+            return emit_token(current, scanner, TOK_ADD);
+        };
+        case '*':
+            return emit_token(current, scanner, TOK_MUL);
+        case '/':
+            return emit_token(current, scanner, TOK_DIV);
+        case '%':
+            return emit_token(current, scanner, TOK_MOD);
+        case '!': {
+            if (scan_peek(scanner) == '=') {
+                scan_next(scanner);
+                return emit_token(current, scanner, TOK_NOTEQ);
+            }
+            return emit_token(current, scanner, TOK_NOT);
+        };
+        case '=': {
+            if (scan_peek(scanner) == '=') {
+                scan_next(scanner);
+                return emit_token(current, scanner, TOK_EQ);
+            }
+            return emit_token(current, scanner, TOK_ASSIGN);
+        };
+        case '<': {
+            char p = scan_peek(scanner);
+            if (p == '=') {
+                scan_next(scanner);
+                return emit_token(current, scanner, TOK_LE);
+            }
+            if (p == '<') {
+                scan_next(scanner);
+                return emit_token(current, scanner, TOK_BITLSHIFT);
+            }
+            return emit_token(current, scanner, TOK_LT);
+        };
+        case '>': {
+            char p = scan_peek(scanner);
+            if (p == '=') {
+                scan_next(scanner);
+                return emit_token(current, scanner, TOK_GE);
+            }
+            if (p == '>') {
+                scan_next(scanner);
+                return emit_token(current, scanner, TOK_BITRSHIFT);
+            }
+            return emit_token(current, scanner, TOK_GT);
+        };
+        case '~':
+            return emit_token(current, scanner, TOK_BITNOT);
+        case '&': {
+            if (scan_peek(scanner) == '&') {
+                scan_next(scanner);
+                return emit_token(current, scanner, TOK_AND);
+            }
+            return emit_token(current, scanner, TOK_BITAND);
+        };
+        case '|': {
+            if (scan_peek(scanner) == '|') {
+                scan_next(scanner);
+                return emit_token(current, scanner, TOK_OR);
+            }
+            return emit_token(current, scanner, TOK_BITOR);
+        };
+        case ':':
+            return emit_token(current, scanner, TOK_COLON);
+        case '.':
+            return emit_token(current, scanner, TOK_DOT);
+        case '@':
+            return emit_token(current, scanner, TOK_AT);
+        case '"': {
+            while (scan_has_next(scanner)) {
+                c = scan_next(scanner);
+                if (c == '\\') {
+                    scan_next(scanner);
+                    continue;
+                }
+                if (c == '"') {
+                    return emit_token(current, scanner, TOK_STRING);
+                }
+            }
+            return emit_token_err(&current, cstr("mismatched string quotes"));
+        };
+    }
+    if (c >= '0' && c <= '9') {
+        *scanner = current;
+        return emit_token_number(scanner);
+    }
+    scan_skip_until_valid(scanner);
+    Str val = current.str;
+    val.size = current.str.size - scanner->str.size;
+    val.size = val.size < 0 ? 0 : val.size;
+    if (val.size == 0) {
+        return emit_token_err(&current, cstr("unexpected character"));
+    }
+    switch (val.mem[0]) {
+        case 'b': {
+            if (str_has_prefix(val, cstr("break"))) {
+                return emit_token(current, scanner, TOK_BREAK);
+            }
+        } break;
+        case 'c': {
+            if (str_has_prefix(val, cstr("case"))) {
+                return emit_token(current, scanner, TOK_CASE);
+            }
+            if (str_has_prefix(val, cstr("continue"))) {
+                return emit_token(current, scanner, TOK_CONTINUE);
+            }
+        } break;
+        case 'f': {
+            if (str_has_prefix(val, cstr("false"))) {
+                return emit_token(current, scanner, TOK_FALSE);
+            }
+            if (str_has_prefix(val, cstr("fun"))) {
+                return emit_token(current, scanner, TOK_FUN);
+            }
+        } break;
+        case 'i': {
+            if (str_has_prefix(val, cstr("if"))) {
+                return emit_token(current, scanner, TOK_IF);
+            }
+        } break;
+        case 'l': {
+            if (str_has_prefix(val, cstr("let"))) {
+                return emit_token(current, scanner, TOK_LET);
+            }
+        } break;
+        case 'm': {
+            if (str_has_prefix(val, cstr("match"))) {
+                return emit_token(current, scanner, TOK_MATCH);
+            }
+        } break;
+        case 'n': {
+            if (str_has_prefix(val, cstr("nil"))) {
+                return emit_token(current, scanner, TOK_NIL);
+            }
+        } break;
+        case 'r': {
+            if (str_has_prefix(val, cstr("return"))) {
+                return emit_token(current, scanner, TOK_RETURN);
+            }
+        } break;
+        case 's': {
+            if (str_has_prefix(val, cstr("set"))) {
+                return emit_token(current, scanner, TOK_SET);
+            }
+            if (str_has_prefix(val, cstr("struct"))) {
+                return emit_token(current, scanner, TOK_STRUCT);
+            }
+        } break;
+        case 't': {
+            if (str_has_prefix(val, cstr("true"))) {
+                return emit_token(current, scanner, TOK_TRUE);
+            }
+        } break;
+        case 'w': {
+            if (str_has_prefix(val, cstr("while"))) {
+                return emit_token(current, scanner, TOK_WHILE);
+            }
+        } break;
    }
-    return tokens;
+    return emit_token(current, scanner, TOK_SYMBOL);
 }
diff --git a/src/lexer.h b/src/lexer.h
deleted file mode 100644
index 949abaf..0000000
--- a/src/lexer.h
+++ /dev/null
@@ -1,99 +0,0 @@
-#ifndef BDL_LEXER_H
-#define BDL_LEXER_H
-#include "string_view.h"
-typedef enum TokenType {
-    TOKEN_UNKNOWN = 0,
-    // Parentheses.
-    TOKEN_LPAREN,
-    TOKEN_RPAREN,
-    TOKEN_LSQUARE,
-    TOKEN_RSQUARE,
-    TOKEN_LCURLY,
-    TOKEN_RCURLY,
-    // Primitive types.
-    TOKEN_NUMBER,
-    TOKEN_SYMBOL,
-    TOKEN_STRING,
-    TOKEN_NIL,
-    TOKEN_TRUE,
-    TOKEN_FALSE,
-    // Keywords.
-    TOKEN_LAMBDA,
-    TOKEN_IF,
-    TOKEN_DEF,
-    TOKEN_SET,
-    TOKEN_FUN,
-    TOKEN_STRUCT,
-    // Arithmetic ops.
-    TOKEN_ADD,
-    TOKEN_SUB,
-    TOKEN_MUL,
-    TOKEN_DIV,
-    TOKEN_MOD,
-    // Boolean operations.
-    TOKEN_NOT,
-    TOKEN_AND,
-    TOKEN_OR,
-    TOKEN_EQ,
-    TOKEN_LT,
-    TOKEN_GT,
-    TOKEN_LE,
-    TOKEN_GE,
-    // Special operators.
-    TOKEN_COLON,
-    TOKEN_DOT,
-    TOKEN_AT,
-    // End of file.
-    TOKEN_EOF,
-} TokenType;
-typedef struct Token {
-    TokenType type;
-    StringView value;
-    size_t line;
-    size_t col;
-} Token;
-typedef struct Scanner {
-    StringView current;
-    size_t line_number;
-    size_t col_number;
-    size_t offset;
-} Scanner;
-// Print a token to standard output for debugging purposes.
-void print_token(Token tok);
-// Same functionality as with StringView, but keeping track of line and column
-// numbers.
-char scan_next(Scanner *scanner);
-char scan_peek(const Scanner *scanner);
-// Check if the current scanner still have characters left.
-bool scan_has_next(const Scanner *scanner);
-// Advance the scanner until we ran out of whitespace.
-void skip_whitespace(Scanner *scanner);
-// Check if a given character is a delimiter.
-bool is_delimiter(char c);
-// Extract the token type from the current string.
-TokenType find_token_type(const StringView value);
-// Generate a list of tokens from the given string.
-Token * tokenize(const StringView *sv);
-// Display tokens from token list.
-void print_tokens(Token *tokens);
-#endif // BDL_LEXER_H
diff --git a/src/main.c b/src/main.c
index edd70aa..9848b8b 100644
--- a/src/main.c
+++ b/src/main.c
@@ -3,6 +3,7 @@
 #include <stdlib.h>
 #include "badlib.h"
+#include "lexer.c"
 typedef enum ExecMode {
    RUN_NORMAL,
@@ -14,607 +15,11 @@ typedef enum ExecMode {
 static ExecMode mode = RUN_NORMAL;
-#define LEXER_MEM GB(2)
 void
 init(void) {
    log_init_default();
 }
-typedef enum TokenType {
-    TOK_UNKNOWN = 0,
-    // Parentheses.
-    TOK_LPAREN,   // (
-    TOK_RPAREN,   // )
-    TOK_LSQUARE,  // [
-    TOK_RSQUARE,  // ]
-    TOK_LCURLY,   // {
-    TOK_RCURLY,   // }
-    // Basic literals.
-    TOK_NUMBER,
-    TOK_SYMBOL,
-    TOK_STRING,
-    // Keywords.
-    TOK_BREAK,     // break
-    TOK_CASE,      // case
-    TOK_CONTINUE,  // continue
-    TOK_FALSE,     // false
-    TOK_FUN,       // fun
-    TOK_IF,        // if
-    TOK_LET,       // let
-    TOK_MATCH,     // match
-    TOK_NIL,       // nil
-    TOK_RETURN,    // return
-    TOK_SET,       // set
-    TOK_STRUCT,    // struct
-    TOK_TRUE,      // true
-    TOK_WHILE,     // while
-    // Arithmetic ops.
-    TOK_ADD,  // +
-    TOK_SUB,  // -
-    TOK_MUL,  // *
-    TOK_DIV,  // /
-    TOK_MOD,  // %
-    // Logical ops.
-    TOK_NOT,    // !
-    TOK_AND,    // &&
-    TOK_OR,     // ||
-    TOK_EQ,     // ==
-    TOK_NOTEQ,  // !=
-    TOK_LT,     // <
-    TOK_GT,     // >
-    TOK_LE,     // <=
-    TOK_GE,     // >=
-    // Bitwise ops.
-    TOK_BITNOT,     // ~
-    TOK_BITAND,     // &
-    TOK_BITOR,      // |
-    TOK_BITLSHIFT,  // <<
-    TOK_BITRSHIFT,  // >>
-    // Special ops.
-    TOK_COLON,   // :
-    TOK_DOT,     // .
-    TOK_AT,      // @
-    TOK_ASSIGN,  // =
-    // End of file.
-    TOK_EOF,
-} TokenType;
-Str token_str[] = {
-    [TOK_UNKNOWN] = cstr("UNKNOWN"),
-    // Parentheses.
-    [TOK_LPAREN] = cstr("LPAREN"),
-    [TOK_RPAREN] = cstr("RPAREN"),
-    [TOK_LSQUARE] = cstr("LSQUARE"),
-    [TOK_RSQUARE] = cstr("RSQUARE"),
-    [TOK_LCURLY] = cstr("LCURLY"),
-    [TOK_RCURLY] = cstr("RCURLY"),
-    // Basic literals.
-    [TOK_NUMBER] = cstr("NUMBER"),
-    [TOK_SYMBOL] = cstr("SYMBOL"),
-    [TOK_STRING] = cstr("STRING"),
-    // Keywords.
-    [TOK_BREAK] = cstr("BREAK"),
-    [TOK_CASE] = cstr("CASE"),
-    [TOK_CONTINUE] = cstr("CONTINUE"),
-    [TOK_FALSE] = cstr("FALSE"),
-    [TOK_FUN] = cstr("FUN"),
-    [TOK_IF] = cstr("IF"),
-    [TOK_LET] = cstr("LET"),
-    [TOK_MATCH] = cstr("MATCH"),
-    [TOK_NIL] = cstr("NIL"),
-    [TOK_RETURN] = cstr("RETURN"),
-    [TOK_SET] = cstr("SET"),
-    [TOK_STRUCT] = cstr("STRUCT"),
-    [TOK_TRUE] = cstr("TRUE"),
-    [TOK_WHILE] = cstr("WHILE"),
-    // Arithmetic ops.
-    [TOK_ADD] = cstr("ADD"),
-    [TOK_SUB] = cstr("SUB"),
-    [TOK_MUL] = cstr("MUL"),
-    [TOK_DIV] = cstr("DIV"),
-    [TOK_MOD] = cstr("MOD"),
-    // Logical ops.
-    [TOK_NOT] = cstr("NOT"),
-    [TOK_AND] = cstr("AND"),
-    [TOK_OR] = cstr("OR"),
-    [TOK_EQ] = cstr("EQ"),
-    [TOK_NOTEQ] = cstr("NOTEQ"),
-    [TOK_LT] = cstr("LT"),
-    [TOK_GT] = cstr("GT"),
-    [TOK_LE] = cstr("LE"),
-    [TOK_GE] = cstr("GE"),
-    // Bitwise ops.
-    [TOK_BITNOT] = cstr("BITNOT"),
-    [TOK_BITAND] = cstr("BITAND"),
-    [TOK_BITOR] = cstr("BITOR"),
-    [TOK_BITLSHIFT] = cstr("BITLSHIFT"),
-    [TOK_BITRSHIFT] = cstr("BITRSHIFT"),
-    // Special ops.
-    [TOK_COLON] = cstr("COLON"),
-    [TOK_DOT] = cstr("DOT"),
-    [TOK_AT] = cstr("AT"),
-    [TOK_ASSIGN] = cstr("ASSIGN"),
-    // End of file.
-    [TOK_EOF] = cstr("EOF"),
-};
-typedef struct Token {
-    TokenType type;
-    Str val;
-    sz line;
-    sz col;
-} Token;
-typedef struct Scanner {
-    Str str;
-    sz line;
-    sz col;
-    Arena *storage;
-} Scanner;
-char
-scan_next(Scanner *scanner) {
-    char c = str_next(&scanner->str);
-    if (c == '\n') {
-        scanner->line++;
-        scanner->col = 0;
-    } else {
-        scanner->col++;
-    }
-    return c;
-}
-bool
-scan_has_next(Scanner *scanner) {
-    return scanner->str.size;
-}
-char
-scan_peek(Scanner *scanner) {
-    return str_peek(scanner->str);
-}
-Token
-emit_token(Scanner current, Scanner *scanner, TokenType t) {
-    Str val = current.str;
-    val.size = current.str.size - scanner->str.size;
-    val.size = val.size < 0 ? 0 : val.size;
-    return (Token){
-        .val = val,
-        .line = current.line + 1,
-        .col = current.col + 1,
-        .type = t,
-    };
-}
-Token
-emit_token_err(Scanner *scanner, Str err_msg) {
-    return (Token){
-        .line = scanner->line + 1,
-        .col = scanner->col + 1,
-        .val = err_msg,
-        .type = TOK_UNKNOWN,
-    };
-}
-void
-scan_skip_line(Scanner *scanner) {
-    SearchResult newline = array_find_next(scanner->str, cstr("\n"));
-    if (newline.found) {
-        scanner->str.mem += newline.pos + 1;
-        scanner->str.size -= newline.pos + 1;
-        scanner->line++;
-        scanner->col = 0;
-    }
-}
-void
-scan_skip_whitespace(Scanner *scanner) {
-    while (scan_has_next(scanner)) {
-        char c = scan_peek(scanner);
-        switch (c) {
-            case ' ':
-            case ',':  // Commas are just syntactic sugar.
-            case '\f':
-            case '\n':
-            case '\r':
-            case '\t':
-            case '\v': {
-                scan_next(scanner);
-            } break;
-            case ';': {
-                // Found a comment! (skip)
-                scan_skip_line(scanner);
-            } break;
-            default: {
-                return;
-            } break;
-        }
-    }
-}
-bool
-is_valid_split(char c) {
-    switch (c) {
-        case ';':
-        case '(':
-        case ')':
-        case '[':
-        case ']':
-        case '{':
-        case '}':
-        case '+':
-        case '-':
-        case '*':
-        case '/':
-        case '%':
-        case '!':
-        case '=':
-        case '<':
-        case '>':
-        case '~':
-        case '&':
-        case '|':
-        case ':':
-        case '.':
-        case '@':
-        case '"':
-        case ' ':
-        case ',':
-        case '\f':
-        case '\n':
-        case '\r':
-        case '\t':
-        case '\v': {
-            return true;
-        } break;
-    }
-    return false;
-}
-void
-scan_skip_until_valid(Scanner *scanner) {
-    while (scan_has_next(scanner)) {
-        char c = scan_peek(scanner);
-        if (is_valid_split(c)) {
-            return;
-        }
-        scan_next(scanner);
-    }
-}
-Token
-emit_token_number(Scanner *scanner) {
-    Scanner current = *scanner;
-    char c = scan_peek(scanner);
-    if (c == '+' || c == '-') {
-        scan_next(scanner);
-        if (str_has_prefix(scanner->str, cstr("0b")) ||
-            str_has_prefix(scanner->str, cstr("0x"))) {
-            scan_skip_until_valid(scanner);
-            return emit_token_err(
-                &current,
-                cstr("malformed number: binary/hex numbers can't be signed"));
-        }
-    }
-    if (str_has_prefix(scanner->str, cstr("0b"))) {
-        scan_next(scanner);
-        scan_next(scanner);
-        while (scan_has_next(scanner)) {
-            c = scan_peek(scanner);
-            if (c == '0' || c == '1' || c == '_') {
-                scan_next(scanner);
-                continue;
-            }
-            if (is_valid_split(c)) {
-                return emit_token(current, scanner, TOK_NUMBER);
-            }
-            scan_skip_until_valid(scanner);
-            return emit_token_err(
-                &current, cstr("malformed number: invalid binary number"));
-        }
-    } else if (str_has_prefix(scanner->str, cstr("0x"))) {
-        scan_next(scanner);
-        scan_next(scanner);
-        while (scan_has_next(scanner)) {
-            c = scan_peek(scanner);
-            if ((c >= '0' && c <= '9') || (c >= 'a' && c <= 'f') ||
-                (c >= 'A' && c <= 'F') || c == '_') {
-                scan_next(scanner);
-                continue;
-            }
-            if (is_valid_split(c)) {
-                return emit_token(current, scanner, TOK_NUMBER);
-            }
-            scan_skip_until_valid(scanner);
-            return emit_token_err(&current,
-                                  cstr("malformed number: invalid hex number"));
-        }
-    } else {
-        // Integral.
-        while (scan_has_next(scanner)) {
-            c = scan_peek(scanner);
-            if (c == '.') {
-                scan_next(scanner);
-                break;
-            }
-            if ((c >= '0' && c <= '9') || c == '_') {
-                scan_next(scanner);
-                continue;
-            }
-            if (is_valid_split(c)) {
-                return emit_token(current, scanner, TOK_NUMBER);
-            }
-            scan_skip_until_valid(scanner);
-            return emit_token_err(&current, cstr("malformed number"));
-        }
-        c = scan_peek(scanner);
-        if (!(c >= '0' && c <= '9')) {
-            return emit_token_err(&current,
-                                  cstr("malformed number: no decimal digits"));
-        }
-        // Decimals.
-        while (scan_has_next(scanner)) {
-            c = scan_peek(scanner);
-            if (c == 'e' || c == 'E') {
-                scan_next(scanner);
-                break;
-            }
-            if ((c >= '0' && c <= '9') || c == '_') {
-                scan_next(scanner);
-                continue;
-            }
-            if (is_valid_split(c)) {
-                return emit_token(current, scanner, TOK_NUMBER);
-            }
-            scan_skip_until_valid(scanner);
-            return emit_token_err(&current, cstr("malformed number"));
-        }
-        // Exponent.
-        c = scan_peek(scanner);
-        if (c == '+' || c == '-') {
-            scan_next(scanner);
-        }
-        while (scan_has_next(scanner)) {
-            c = scan_peek(scanner);
-            if ((c >= '0' && c <= '9') || c == '_') {
-                scan_next(scanner);
-                continue;
-            }
-            if (c == '.') {
-                scan_next(scanner);
-                return emit_token_err(
-                    &current,
-                    cstr("malformed number: decimals not allowed on exponent"));
-            }
-            if (is_valid_split(c)) {
-                return emit_token(current, scanner, TOK_NUMBER);
-            }
-            scan_skip_until_valid(scanner);
-            return emit_token_err(&current, cstr("malformed number"));
-        }
-    }
-    return emit_token_err(&current, cstr("malformed number"));
-}
-Token
-scan_token(Scanner *scanner) {
-    assert(scanner);
-    scan_skip_whitespace(scanner);
-    if (!scan_has_next(scanner)) {
-        return emit_token(*scanner, scanner, TOK_EOF);
-    }
-    Scanner current = *scanner;
-    char c = scan_next(scanner);
-    switch (c) {
-        case '(':
-            return emit_token(current, scanner, TOK_LPAREN);
-        case ')':
-            return emit_token(current, scanner, TOK_RPAREN);
-        case '[':
-            return emit_token(current, scanner, TOK_LSQUARE);
-        case ']':
-            return emit_token(current, scanner, TOK_RSQUARE);
-        case '{':
-            return emit_token(current, scanner, TOK_LCURLY);
-        case '}':
-            return emit_token(current, scanner, TOK_RCURLY);
-        case '+': {
-            char p = scan_peek(scanner);
-            if (p >= '0' && p <= '9') {
-                *scanner = current;
-                return emit_token_number(scanner);
-            }
-            return emit_token(current, scanner, TOK_ADD);
-        };
-        case '-': {
-            char p = scan_peek(scanner);
-            if (p >= '0' && p <= '9') {
-                *scanner = current;
-                return emit_token_number(scanner);
-            }
-            return emit_token(current, scanner, TOK_ADD);
-        };
-        case '*':
-            return emit_token(current, scanner, TOK_MUL);
-        case '/':
-            return emit_token(current, scanner, TOK_DIV);
-        case '%':
-            return emit_token(current, scanner, TOK_MOD);
-        case '!': {
-            if (scan_peek(scanner) == '=') {
-                scan_next(scanner);
-                return emit_token(current, scanner, TOK_NOTEQ);
-            }
-            return emit_token(current, scanner, TOK_NOT);
-        };
-        case '=': {
-            if (scan_peek(scanner) == '=') {
-                scan_next(scanner);
-                return emit_token(current, scanner, TOK_EQ);
-            }
-            return emit_token(current, scanner, TOK_ASSIGN);
-        };
-        case '<': {
-            char p = scan_peek(scanner);
-            if (p == '=') {
-                scan_next(scanner);
-                return emit_token(current, scanner, TOK_LE);
-            }
-            if (p == '<') {
-                scan_next(scanner);
-                return emit_token(current, scanner, TOK_BITLSHIFT);
-            }
-            return emit_token(current, scanner, TOK_LT);
-        };
-        case '>': {
-            char p = scan_peek(scanner);
-            if (p == '=') {
-                scan_next(scanner);
-                return emit_token(current, scanner, TOK_GE);
-            }
-            if (p == '>') {
-                scan_next(scanner);
-                return emit_token(current, scanner, TOK_BITRSHIFT);
-            }
-            return emit_token(current, scanner, TOK_GT);
-        };
-        case '~':
-            return emit_token(current, scanner, TOK_BITNOT);
-        case '&': {
-            if (scan_peek(scanner) == '&') {
-                scan_next(scanner);
-                return emit_token(current, scanner, TOK_AND);
-            }
-            return emit_token(current, scanner, TOK_BITAND);
-        };
-        case '|': {
-            if (scan_peek(scanner) == '|') {
-                scan_next(scanner);
-                return emit_token(current, scanner, TOK_OR);
-            }
-            return emit_token(current, scanner, TOK_BITOR);
-        };
-        case ':':
-            return emit_token(current, scanner, TOK_COLON);
-        case '.':
-            return emit_token(current, scanner, TOK_DOT);
-        case '@':
-            return emit_token(current, scanner, TOK_AT);
-        case '"': {
-            while (scan_has_next(scanner)) {
-                c = scan_next(scanner);
-                if (c == '\\') {
-                    scan_next(scanner);
-                    continue;
-                }
-                if (c == '"') {
-                    return emit_token(current, scanner, TOK_STRING);
-                }
-            }
-            return emit_token_err(&current, cstr("mismatched string quotes"));
-        };
-    }
-    if (c >= '0' && c <= '9') {
-        *scanner = current;
-        return emit_token_number(scanner);
-    }
-    scan_skip_until_valid(scanner);
-    Str val = current.str;
-    val.size = current.str.size - scanner->str.size;
-    val.size = val.size < 0 ? 0 : val.size;
-    if (val.size == 0) {
-        return emit_token_err(&current, cstr("unexpected character"));
-    }
-    switch (val.mem[0]) {
-        case 'b': {
-            if (str_has_prefix(val, cstr("break"))) {
-                return emit_token(current, scanner, TOK_BREAK);
-            }
-        } break;
-        case 'c': {
-            if (str_has_prefix(val, cstr("case"))) {
-                return emit_token(current, scanner, TOK_CASE);
-            }
-            if (str_has_prefix(val, cstr("continue"))) {
-                return emit_token(current, scanner, TOK_CONTINUE);
-            }
-        } break;
-        case 'f': {
-            if (str_has_prefix(val, cstr("false"))) {
-                return emit_token(current, scanner, TOK_FALSE);
-            }
-            if (str_has_prefix(val, cstr("fun"))) {
-                return emit_token(current, scanner, TOK_FUN);
-            }
-        } break;
-        case 'i': {
-            if (str_has_prefix(val, cstr("if"))) {
-                return emit_token(current, scanner, TOK_IF);
-            }
-        } break;
-        case 'l': {
-            if (str_has_prefix(val, cstr("let"))) {
-                return emit_token(current, scanner, TOK_LET);
-            }
-        } break;
-        case 'm': {
-            if (str_has_prefix(val, cstr("match"))) {
-                return emit_token(current, scanner, TOK_MATCH);
-            }
-        } break;
-        case 'n': {
-            if (str_has_prefix(val, cstr("nil"))) {
-                return emit_token(current, scanner, TOK_NIL);
-            }
-        } break;
-        case 'r': {
-            if (str_has_prefix(val, cstr("return"))) {
-                return emit_token(current, scanner, TOK_RETURN);
-            }
-        } break;
-        case 's': {
-            if (str_has_prefix(val, cstr("set"))) {
-                return emit_token(current, scanner, TOK_SET);
-            }
-            if (str_has_prefix(val, cstr("struct"))) {
-                return emit_token(current, scanner, TOK_STRUCT);
-            }
-        } break;
-        case 't': {
-            if (str_has_prefix(val, cstr("true"))) {
-                return emit_token(current, scanner, TOK_TRUE);
-            }
-        } break;
-        case 'w': {
-            if (str_has_prefix(val, cstr("while"))) {
-                return emit_token(current, scanner, TOK_WHILE);
-            }
-        } break;
-    }
-    return emit_token(current, scanner, TOK_SYMBOL);
-}
 void
 process_file(Str path) {
    Arena lexer_arena = arena_create(LEXER_MEM, os_allocator);
@@ -628,36 +33,24 @@ process_file(Str path) {
    Scanner scanner = {
        .str = file.data,
-        .storage = &lexer_arena,
    };
    Token tok = {0};
+    sz errors = 0;
    while (tok.type != TOK_EOF) {
        tok = scan_token(&scanner);
-        eprintln("%s:%d:%d:%s %s", path, tok.line, tok.col, token_str[tok.type],
+        if (tok.type == TOK_UNKNOWN) {
-                 tok.val);
+            eprintln("%s:%d:%d:%s %s", path, tok.line, tok.col,
+                     token_str[tok.type], tok.val);
+            errors++;
+        }
    }
-    // while (true) {
-    //     Token tok = scan_token(&scanner);
-    //     println("%s:%d:%d:%s %s", path, tok.line, tok.col,
-    //     token_str[tok.type],
-    //             tok.val);
-    //     if (tok.type == TOK_EOF) break;
-    // }
-    // Str scanner = file.data;
+    // Only proceed if there are no errors.
-    // // NOTE: Testing file read line by line.
+    if (errors) {
-    // for (sz i = 0; scanner.size != 0; i++) {
+        goto stop;
-    //     Str line = str_split(&scanner, cstr("\n"));
+    }
-    //     println("%x{4}  %s", i + 1, line);
-    // }
-    // println("<<< %x{4} %b{4} %f{2} %s %{Arena} >>>", 123, 3, 1.345,
-    //         cstr("BOOM!"), &logger_inf.storage);
-    // println("%{Mem}", &(Array){lexer_arena.beg, lexer_arena.size});
+stop:
-    // eprintln("%s:%d:%d: %s -> %c", path, 1, 1, cstr("error: testing string
-    // logger"), 'X'); while (true) {}
-    // TODO: run lexer.
    // Free up resources.
    arena_destroy(&lexer_arena, os_allocator);
 }
author	Bad Diode <bd@badd10de.dev>	2024-06-15 16:52:36 +0200
committer	Bad Diode <bd@badd10de.dev>	2024-06-15 16:52:36 +0200
commit	e7cd0d47a603e4199b0ee7daa2434fc0db602bad (patch)
tree	511cfbe2cea66e45b4ca7669ed9a101763ae3537
parent	893b52223d274c675272cee55768a9d5853420fb (diff)
download	bdl-e7cd0d47a603e4199b0ee7daa2434fc0db602bad.tar.gz bdl-e7cd0d47a603e4199b0ee7daa2434fc0db602bad.zip