rust-analyzer/crates/ra_mbe/src/subtree_source.rs

use ra_parser::{TokenSource, Token};
use ra_syntax::{classify_literal, SmolStr, SyntaxKind, SyntaxKind::*, T};
use std::cell::{RefCell, Cell};
use tt::buffer::{TokenBuffer, Cursor};

#[derive(Debug, Clone, Eq, PartialEq)]
struct TtToken {
    pub kind: SyntaxKind,
    pub is_joint_to_next: bool,
    pub text: SmolStr,
}

pub(crate) struct SubtreeTokenSource<'a> {
    start: Cursor<'a>,
    cursor: Cell<Cursor<'a>>,
    cached: RefCell<Vec<Option<TtToken>>>,
    curr: (Token, usize),
}

impl<'a> SubtreeTokenSource<'a> {
    // Helper function used in test
    #[allow(unused)]
    pub fn text(&self) -> SmolStr {
        match self.get(self.curr.1) {
            Some(tt) => tt.text,
            _ => SmolStr::new(""),
        }
    }
}

impl<'a> SubtreeTokenSource<'a> {
    pub fn new(buffer: &'a TokenBuffer) -> SubtreeTokenSource<'a> {
        let cursor = buffer.begin();

        let mut res = SubtreeTokenSource {
            curr: (Token { kind: EOF, is_jointed_to_next: false }, 0),
            start: cursor,
            cursor: Cell::new(cursor),
            cached: RefCell::new(Vec::with_capacity(10)),
        };
        res.curr = (res.mk_token(0), 0);
        res
    }

    pub(crate) fn bump_n(&mut self, parsed_tokens: usize) -> Vec<tt::TokenTree> {
        let res = self.collect_token_trees(parsed_tokens);
        res
    }

    fn mk_token(&self, pos: usize) -> Token {
        match self.get(pos) {
            Some(tt) => Token { kind: tt.kind, is_jointed_to_next: tt.is_joint_to_next },
            None => Token { kind: EOF, is_jointed_to_next: false },
        }
    }

    fn get(&self, pos: usize) -> Option<TtToken> {
        let mut cached = self.cached.borrow_mut();
        if pos < cached.len() {
            return cached[pos].clone();
        }

        while pos >= cached.len() {
            let cursor = self.cursor.get();
            if cursor.eof() {
                cached.push(None);
                continue;
            }

            match cursor.token_tree() {
                Some(tt::TokenTree::Leaf(leaf)) => {
                    cached.push(Some(convert_leaf(&leaf)));
                    self.cursor.set(cursor.bump());
                }
                Some(tt::TokenTree::Subtree(subtree)) => {
                    self.cursor.set(cursor.subtree().unwrap());
                    cached.push(Some(convert_delim(subtree.delimiter, false)));
                }
                None => {
                    if let Some(subtree) = cursor.end() {
                        cached.push(Some(convert_delim(subtree.delimiter, true)));
                        self.cursor.set(cursor.bump());
                    }
                }
            }
        }

        return cached[pos].clone();
    }

    fn collect_token_trees(&self, n: usize) -> Vec<tt::TokenTree> {
        let mut res = vec![];

        let mut pos = 0;
        let mut cursor = self.start;
        let mut level = 0;

        while pos < n {
            if cursor.eof() {
                break;
            }

            match cursor.token_tree() {
                Some(tt::TokenTree::Leaf(leaf)) => {
                    if level == 0 {
                        res.push(leaf.into());
                    }
                    cursor = cursor.bump();
                    pos += 1;
                }
                Some(tt::TokenTree::Subtree(subtree)) => {
                    if level == 0 {
                        res.push(subtree.into());
                    }
                    pos += 1;
                    level += 1;
                    cursor = cursor.subtree().unwrap();
                }

                None => {
                    if let Some(_) = cursor.end() {
                        level -= 1;
                        pos += 1;
                        cursor = cursor.bump();
                    }
                }
            }
        }

        res
    }
}

impl<'a> TokenSource for SubtreeTokenSource<'a> {
    fn current(&self) -> Token {
        self.curr.0
    }

    /// Lookahead n token
    fn lookahead_nth(&self, n: usize) -> Token {
        self.mk_token(self.curr.1 + n)
    }

    /// bump cursor to next token
    fn bump(&mut self) {
        if self.current().kind == EOF {
            return;
        }

        self.curr = (self.mk_token(self.curr.1 + 1), self.curr.1 + 1)
    }

    /// Is the current token a specified keyword?
    fn is_keyword(&self, kw: &str) -> bool {
        match self.get(self.curr.1) {
            Some(t) => t.text == *kw,
            _ => false,
        }
    }
}

fn convert_delim(d: tt::Delimiter, closing: bool) -> TtToken {
    let (kinds, texts) = match d {
        tt::Delimiter::Parenthesis => ([T!['('], T![')']], "()"),
        tt::Delimiter::Brace => ([T!['{'], T!['}']], "{}"),
        tt::Delimiter::Bracket => ([T!['['], T![']']], "[]"),
        tt::Delimiter::None => ([L_DOLLAR, R_DOLLAR], ""),
    };

    let idx = closing as usize;
    let kind = kinds[idx];
    let text = if texts.len() > 0 { &texts[idx..texts.len() - (1 - idx)] } else { "" };
    TtToken { kind, is_joint_to_next: false, text: SmolStr::new(text) }
}

fn convert_literal(l: &tt::Literal) -> TtToken {
    let kind =
        classify_literal(&l.text).map(|tkn| tkn.kind).unwrap_or_else(|| match l.text.as_ref() {
            "true" => T![true],
            "false" => T![false],
            _ => panic!("Fail to convert given literal {:#?}", &l),
        });

    TtToken { kind, is_joint_to_next: false, text: l.text.clone() }
}

fn convert_ident(ident: &tt::Ident) -> TtToken {
    let kind = if let Some('\'') = ident.text.chars().next() {
        LIFETIME
    } else {
        SyntaxKind::from_keyword(ident.text.as_str()).unwrap_or(IDENT)
    };

    TtToken { kind, is_joint_to_next: false, text: ident.text.clone() }
}

fn convert_punct(p: &tt::Punct) -> TtToken {
    let kind = match p.char {
        // lexer may produce compound tokens for these ones
        '.' => T![.],
        ':' => T![:],
        '=' => T![=],
        '!' => T![!],
        '-' => T![-],
        c => SyntaxKind::from_char(c).unwrap(),
    };
    let text = {
        let mut buf = [0u8; 4];
        let s: &str = p.char.encode_utf8(&mut buf);
        SmolStr::new(s)
    };
    TtToken { kind, is_joint_to_next: p.spacing == tt::Spacing::Joint, text }
}

fn convert_leaf(leaf: &tt::Leaf) -> TtToken {
    match leaf {
        tt::Leaf::Literal(l) => convert_literal(l),
        tt::Leaf::Ident(ident) => convert_ident(ident),
        tt::Leaf::Punct(punct) => convert_punct(punct),
    }
}
Change TokenSource to iteration based 2019-05-25 12:31:53 +00:00			`use ra_parser::{TokenSource, Token};`
apply T! macro where it is possible 2019-05-15 12:35:47 +00:00			`use ra_syntax::{classify_literal, SmolStr, SyntaxKind, SyntaxKind::*, T};`
Refactor SubtreeSource 2019-05-22 18:00:34 +00:00			`use std::cell::{RefCell, Cell};`
			`use tt::buffer::{TokenBuffer, Cursor};`
Refactoring subtree_source 2019-04-07 13:42:53 +00:00
Use SubtreeWalker instread of flatten TtToken 2019-04-08 07:58:02 +00:00			`#[derive(Debug, Clone, Eq, PartialEq)]`
Refactoring subtree_source 2019-04-07 13:42:53 +00:00			`struct TtToken {`
			`pub kind: SyntaxKind,`
			`pub is_joint_to_next: bool,`
			`pub text: SmolStr,`
			`}`

Remove Queier and SubtreeWalk 2019-05-27 14:56:21 +00:00			`pub(crate) struct SubtreeTokenSource<'a> {`
Refactor SubtreeSource 2019-05-22 18:00:34 +00:00			`start: Cursor<'a>,`
			`cursor: Cell<Cursor<'a>>,`
Add cached for SubtreeSource 2019-04-22 14:46:39 +00:00			`cached: RefCell<Vec<Option<TtToken>>>,`
Remove Queier and SubtreeWalk 2019-05-27 14:56:21 +00:00			`curr: (Token, usize),`
			`}`

			`impl<'a> SubtreeTokenSource<'a> {`
			`// Helper function used in test`
			`#[allow(unused)]`
			`pub fn text(&self) -> SmolStr {`
			`match self.get(self.curr.1) {`
			`Some(tt) => tt.text,`
			`_ => SmolStr::new(""),`
			`}`
			`}`
Use SubtreeWalker instread of flatten TtToken 2019-04-08 07:58:02 +00:00			`}`

Remove Queier and SubtreeWalk 2019-05-27 14:56:21 +00:00			`impl<'a> SubtreeTokenSource<'a> {`
			`pub fn new(buffer: &'a TokenBuffer) -> SubtreeTokenSource<'a> {`
			`let cursor = buffer.begin();`

			`let mut res = SubtreeTokenSource {`
			`curr: (Token { kind: EOF, is_jointed_to_next: false }, 0),`
Refactor SubtreeSource 2019-05-22 18:00:34 +00:00			`start: cursor,`
			`cursor: Cell::new(cursor),`
Add cached for SubtreeSource 2019-04-22 14:46:39 +00:00			`cached: RefCell::new(Vec::with_capacity(10)),`
Remove Queier and SubtreeWalk 2019-05-27 14:56:21 +00:00			`};`
			`res.curr = (res.mk_token(0), 0);`
			`res`
			`}`

			`pub(crate) fn bump_n(&mut self, parsed_tokens: usize) -> Vec<tt::TokenTree> {`
			`let res = self.collect_token_trees(parsed_tokens);`
			`res`
			`}`

			`fn mk_token(&self, pos: usize) -> Token {`
			`match self.get(pos) {`
			`Some(tt) => Token { kind: tt.kind, is_jointed_to_next: tt.is_joint_to_next },`
			`None => Token { kind: EOF, is_jointed_to_next: false },`
Add cached for SubtreeSource 2019-04-22 14:46:39 +00:00			`}`
Refactoring and add some docs 2019-04-08 12:32:21 +00:00			`}`

Refactor SubtreeSource 2019-05-22 18:00:34 +00:00			`fn get(&self, pos: usize) -> Option<TtToken> {`
Add cached for SubtreeSource 2019-04-22 14:46:39 +00:00			`let mut cached = self.cached.borrow_mut();`
			`if pos < cached.len() {`
			`return cached[pos].clone();`
			`}`

			`while pos >= cached.len() {`
Refactor SubtreeSource 2019-05-22 18:00:34 +00:00			`let cursor = self.cursor.get();`
			`if cursor.eof() {`
			`cached.push(None);`
			`continue;`
			`}`
Formatting 2019-05-23 01:31:36 +00:00
Refactor SubtreeSource 2019-05-22 18:00:34 +00:00			`match cursor.token_tree() {`
			`Some(tt::TokenTree::Leaf(leaf)) => {`
			`cached.push(Some(convert_leaf(&leaf)));`
			`self.cursor.set(cursor.bump());`
			`}`
			`Some(tt::TokenTree::Subtree(subtree)) => {`
			`self.cursor.set(cursor.subtree().unwrap());`
			`cached.push(Some(convert_delim(subtree.delimiter, false)));`
			`}`
			`None => {`
			`if let Some(subtree) = cursor.end() {`
			`cached.push(Some(convert_delim(subtree.delimiter, true)));`
			`self.cursor.set(cursor.bump());`
			`}`
			`}`
			`}`
Add cached for SubtreeSource 2019-04-22 14:46:39 +00:00			`}`

			`return cached[pos].clone();`
Refactoring subtree_source 2019-04-07 13:42:53 +00:00			`}`

Change TokenSource to iteration based 2019-05-25 12:31:53 +00:00			`fn collect_token_trees(&self, n: usize) -> Vec<tt::TokenTree> {`
Refactor SubtreeSource 2019-05-22 18:00:34 +00:00			`let mut res = vec![];`
Remove unused code in subtree_source 2019-05-02 02:19:12 +00:00
Refactor SubtreeSource 2019-05-22 18:00:34 +00:00			`let mut pos = 0;`
			`let mut cursor = self.start;`
			`let mut level = 0;`
Refactoring subtree_source 2019-04-07 13:42:53 +00:00
Refactor SubtreeSource 2019-05-22 18:00:34 +00:00			`while pos < n {`
			`if cursor.eof() {`
			`break;`
			`}`
Use SubtreeWalker instread of flatten TtToken 2019-04-08 07:58:02 +00:00
Refactor SubtreeSource 2019-05-22 18:00:34 +00:00			`match cursor.token_tree() {`
			`Some(tt::TokenTree::Leaf(leaf)) => {`
			`if level == 0 {`
			`res.push(leaf.into());`
Remove skip Delimiter::None and handle Dollars 2019-04-12 17:50:05 +00:00			`}`
Refactor SubtreeSource 2019-05-22 18:00:34 +00:00			`cursor = cursor.bump();`
			`pos += 1;`
Remove unused code in subtree_source 2019-05-02 02:19:12 +00:00			`}`
Refactor SubtreeSource 2019-05-22 18:00:34 +00:00			`Some(tt::TokenTree::Subtree(subtree)) => {`
			`if level == 0 {`
			`res.push(subtree.into());`
Use SubtreeWalker instread of flatten TtToken 2019-04-08 07:58:02 +00:00			`}`
Refactor SubtreeSource 2019-05-22 18:00:34 +00:00			`pos += 1;`
			`level += 1;`
			`cursor = cursor.subtree().unwrap();`
Use SubtreeWalker instread of flatten TtToken 2019-04-08 07:58:02 +00:00			`}`

Refactor SubtreeSource 2019-05-22 18:00:34 +00:00			`None => {`
			`if let Some(_) = cursor.end() {`
			`level -= 1;`
			`pos += 1;`
			`cursor = cursor.bump();`
			`}`
			`}`
			`}`
Refactoring subtree_source 2019-04-07 13:42:53 +00:00			`}`

Combine all tokensource to one and refactoring 2019-04-07 16:12:07 +00:00			`res`
			`}`
Use SubtreeWalker instread of flatten TtToken 2019-04-08 07:58:02 +00:00			`}`

Refactoring subtree_source 2019-04-07 13:42:53 +00:00			`impl<'a> TokenSource for SubtreeTokenSource<'a> {`
Change TokenSource to iteration based 2019-05-25 12:31:53 +00:00			`fn current(&self) -> Token {`
			`self.curr.0`
Refactoring subtree_source 2019-04-07 13:42:53 +00:00			`}`
Change TokenSource to iteration based 2019-05-25 12:31:53 +00:00
			`/// Lookahead n token`
			`fn lookahead_nth(&self, n: usize) -> Token {`
			`self.mk_token(self.curr.1 + n)`
			`}`

			`/// bump cursor to next token`
			`fn bump(&mut self) {`
			`if self.current().kind == EOF {`
			`return;`
Fix bug and add expr , pat , ty matcher 2019-04-13 10:38:31 +00:00			`}`
Change TokenSource to iteration based 2019-05-25 12:31:53 +00:00
			`self.curr = (self.mk_token(self.curr.1 + 1), self.curr.1 + 1)`
Refactoring subtree_source 2019-04-07 13:42:53 +00:00			`}`
Change TokenSource to iteration based 2019-05-25 12:31:53 +00:00
			`/// Is the current token a specified keyword?`
			`fn is_keyword(&self, kw: &str) -> bool {`
Remove Queier and SubtreeWalk 2019-05-27 14:56:21 +00:00			`match self.get(self.curr.1) {`
Fix bug and add expr , pat , ty matcher 2019-04-13 10:38:31 +00:00			`Some(t) => t.text == *kw,`
			`_ => false,`
			`}`
Refactoring subtree_source 2019-04-07 13:42:53 +00:00			`}`
			`}`

Remove skip Delimiter::None and handle Dollars 2019-04-12 17:50:05 +00:00			`fn convert_delim(d: tt::Delimiter, closing: bool) -> TtToken {`
Use SubtreeWalker instread of flatten TtToken 2019-04-08 07:58:02 +00:00			`let (kinds, texts) = match d {`
apply T! macro where it is possible 2019-05-15 12:35:47 +00:00			`tt::Delimiter::Parenthesis => ([T!['('], T![')']], "()"),`
			`tt::Delimiter::Brace => ([T!['{'], T!['}']], "{}"),`
			`tt::Delimiter::Bracket => ([T!['['], T![']']], "[]"),`
Remove skip Delimiter::None and handle Dollars 2019-04-12 17:50:05 +00:00			`tt::Delimiter::None => ([L_DOLLAR, R_DOLLAR], ""),`
Use SubtreeWalker instread of flatten TtToken 2019-04-08 07:58:02 +00:00			`};`

			`let idx = closing as usize;`
			`let kind = kinds[idx];`
Remove skip Delimiter::None and handle Dollars 2019-04-12 17:50:05 +00:00			`let text = if texts.len() > 0 { &texts[idx..texts.len() - (1 - idx)] } else { "" };`
Remove unused code in subtree_source 2019-05-02 02:19:12 +00:00			`TtToken { kind, is_joint_to_next: false, text: SmolStr::new(text) }`
Use SubtreeWalker instread of flatten TtToken 2019-04-08 07:58:02 +00:00			`}`
Refactoring subtree_source 2019-04-07 13:42:53 +00:00
Use SubtreeWalker instread of flatten TtToken 2019-04-08 07:58:02 +00:00			`fn convert_literal(l: &tt::Literal) -> TtToken {`
Use panic instead of unwrap 2019-04-25 18:56:44 +00:00			`let kind =`
			`classify_literal(&l.text).map(\|tkn\| tkn.kind).unwrap_or_else(\|\| match l.text.as_ref() {`
apply T! macro where it is possible 2019-05-15 12:35:47 +00:00			`"true" => T![true],`
			`"false" => T![false],`
Use panic instead of unwrap 2019-04-25 18:56:44 +00:00			`_ => panic!("Fail to convert given literal {:#?}", &l),`
			`});`
Add handling `token` seperator in mbe 2019-04-24 15:01:32 +00:00
Remove unused code in subtree_source 2019-05-02 02:19:12 +00:00			`TtToken { kind, is_joint_to_next: false, text: l.text.clone() }`
Use SubtreeWalker instread of flatten TtToken 2019-04-08 07:58:02 +00:00			`}`
Refactoring subtree_source 2019-04-07 13:42:53 +00:00
Use SubtreeWalker instread of flatten TtToken 2019-04-08 07:58:02 +00:00			`fn convert_ident(ident: &tt::Ident) -> TtToken {`
Fix lifetime in tt to syntax node conversion 2019-04-21 04:32:39 +00:00			`let kind = if let Some('\'') = ident.text.chars().next() {`
			`LIFETIME`
			`} else {`
			`SyntaxKind::from_keyword(ident.text.as_str()).unwrap_or(IDENT)`
			`};`

Remove unused code in subtree_source 2019-05-02 02:19:12 +00:00			`TtToken { kind, is_joint_to_next: false, text: ident.text.clone() }`
Use SubtreeWalker instread of flatten TtToken 2019-04-08 07:58:02 +00:00			`}`
Refactoring subtree_source 2019-04-07 13:42:53 +00:00
Remove unused code in subtree_source 2019-05-02 02:19:12 +00:00			`fn convert_punct(p: &tt::Punct) -> TtToken {`
			`let kind = match p.char {`
Make `vis` matcher optional and fix typo 2019-05-02 13:24:51 +00:00			`// lexer may produce compound tokens for these ones`
apply T! macro where it is possible 2019-05-15 12:35:47 +00:00			`'.' => T![.],`
			`':' => T![:],`
			`'=' => T![=],`
			`'!' => T![!],`
			`'-' => T![-],`
Remove unused code in subtree_source 2019-05-02 02:19:12 +00:00			`c => SyntaxKind::from_char(c).unwrap(),`
			`};`
			`let text = {`
			`let mut buf = [0u8; 4];`
			`let s: &str = p.char.encode_utf8(&mut buf);`
			`SmolStr::new(s)`
			`};`
			`TtToken { kind, is_joint_to_next: p.spacing == tt::Spacing::Joint, text }`
Refactoring subtree_source 2019-04-07 13:42:53 +00:00			`}`
Remove skip Delimiter::None and handle Dollars 2019-04-12 17:50:05 +00:00
Remove unused code in subtree_source 2019-05-02 02:19:12 +00:00			`fn convert_leaf(leaf: &tt::Leaf) -> TtToken {`
Remove skip Delimiter::None and handle Dollars 2019-04-12 17:50:05 +00:00			`match leaf {`
			`tt::Leaf::Literal(l) => convert_literal(l),`
			`tt::Leaf::Ident(ident) => convert_ident(ident),`
Remove unused code in subtree_source 2019-05-02 02:19:12 +00:00			`tt::Leaf::Punct(punct) => convert_punct(punct),`
Remove skip Delimiter::None and handle Dollars 2019-04-12 17:50:05 +00:00			`}`
			`}`